箱形图

matplotlib----初探------7箱形图

房东的猫 提交于 2020-01-29 05:27:59
概念 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 箱形图(Box-plot)又称为盒须图、盒式图或箱线图. 是一种用作显示一组数据分散情况资料的统计图。 因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。 上边缘,上四分位数,中位数,下四分位数,下边缘,异常值 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> import numpy as np import matplotlib.pyplot as plt np.random.seed(100) #随机生成100个种子数 data = np.random.normal(size=1000,loc=0,scale =1) plt.boxplot(data) plt.show() 参数一 plt.boxplot(data,sym='<') 参数二: plt.boxplot(data,sym="<",whis=3) 改变须长 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 多个箱形图比较import numpy as npimport matplotlib.pyplot as

箱形图和小提琴图

梦想的初衷 提交于 2019-11-27 04:50:20
箱形图(Box-plot) 又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图,因形状如箱子而得名。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。 箱形图绘制须使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。 箱形图的绘制主要包含六个数据节点,需要先将数据从大到小进行排列,然后分别计算出它的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。 计算过程: 计算上四分位数(Q3),中位数,下四分位数(Q1) 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR, interquartile range)Q3-Q1 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。 为箱线图添加名称,数轴等 分位数 根据其将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。四分位数作为分位数的一种形式