数据的描述统计
一、用图表示数据 定量变量的图表示(直方图、盒形图、茎叶图、散点图) 类型 表示 优点 缺点 用途 直方图 横轴为若干个等宽度的空间,纵轴表示各个区间的频数 体现的样本的频率分布,大致估计总体的分布;容易表示大量数据 无法显示原始数据 看数据各个部分的分布情况 盒形图 横轴为类别,盒子表示数据最小值、最大值、上下四分位点以及离群点 可以看出数据的分布情况以及离群点 无法显示原始数据 看数据各个部分的分布情况 茎叶图 数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面 从统计图上没有原始数据信息的损失;茎叶图中的数据可以随时记录,随时添加,方便记录与表示 只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据;数据量过大不方便显示 数据量不多时需要同时观看数据的分布情况与原数据 散点图 每个点代表一个观测值,横纵坐标分别代表观测值相对于横纵坐标的取值 快速发现多个变量间的主要相关性 适合看两个变量之间的关系(使用气泡图可以增加变量,气泡的颜色大小可以定义为变量,但容易使图显得混乱) 比较跨类别的聚合数据 定性的图表示(饼图和条形图) 类型 表示 优点 缺点 用途 饼图 有许多扇形组成的圆,扇形大小比例等于各个类别的频数或相关数量的比例 描述比例比较直观 不适合描述类别比较多的情况 需要了解各个类别的比例情况,且类别数量不多 条形图