一、箱形图介绍
箱形图(Box Plot),又称为盒须图或箱线图,是一种用作显示一组数据分布情况的统计图。它可以快速展示数据的中位数、四分位数和异常值,常用于比较不同数据集之间的分布差异。箱形图没有展示数据分布的具体形状,而是提供了一种识别数据集中心和离散程度的直观方式。
二、箱形图代表的含义是什么?
箱形图的优势在于可以直观地识别数据的集中趋势、分散程度和潜在的异常值,同时也能比较不同数据集的这些特征。它常用于描述性统计分析和探索性数据分析中。
三、绘制箱形图的步骤
1.计算下四分位数(Q1)、中位数(Median)和上四分位数(Q3)。计算四分位间距(IQR=Q3-Q1)。
2.计算内侧栅栏(内侧的异常值检测限,通常为Q1-1.5*IQR和Q3+1.5*IQR)。
3.识别并表示出异常值(超出内侧栅栏的数据点)。
4.绘制箱体,其中上边缘为Q3,下边缘为Q1。在箱体中绘制中位数。
5.画出胡须,胡须的端点停在内侧栅栏内的最大值和最小值,或最远的非异常值。超过胡须的异常值通常以点来表示。