离散系数

2 数据的概括性度量

我的未来我决定 提交于 2019-12-04 04:50:57
阅读材料为 第四章。 开头先来一个 总体内容的概括 好了: 集中趋势:众数、中位数、平均数 离散程度:异众比率、四分位差、极差、平均差、方差或标准差、离散系数 分布的形状:偏态系数、峰态系数 集中趋势: 分类数据: 众数:一般情况下,只有在数据量较大的时候众数才有意义。 众数可能不存在,也可能有多个。 顺序数据: 分位数、中位数 中位数的位置:(n+1)/2 数值型数据: 平均数:简单平均数、加权平均数、几何平均数 简单平均数很简单就不说了。 根据分组数据计算的平均数称为加权平均数;工作中我们算1-9月的店均销售就是采用加权平均的,因为每个月的店铺数会有变化。用1-9月的销售额之和除以1-9月的店铺数之和。 几何平均数的主要应用是计算现象的平均增长率(当数据出现零值或负值时不宜使用)。 当所平均的各比率数值相差不大时,算术和几何平均的结果差别不大。 众数、中位数、平均数之间的关系: 当数据对称分布时,三者相等; 当数据左偏分布时,平均数被拉向左边,中位数也略偏左边,因此,平均数<中位数<众数 当数据右偏分布时,平均数被拉向右边,中位数也略偏右边,因此,众数<中位数<平均数 三者的应用场合: 众数:数据量大时适用;分类数据。 中位数:不受极端值影响,因此偏态分布时适用;顺序数据。 平均数:受极端值影响大,因此数据对称分布时适用;数值型数据。 集中趋势和离散程度之间的联系: