思考与练习
(A)1个数据文件包含下列数据,5个家庭没有汽车(编码为0),20个家庭有一辆汽车(编码唯1),10个家庭拥有两辆汽车(编码为2)指出下列哪种统计量适用于描述该数据并计算出统计量的值。
A拥有汽车数的众数 B.拥有汽车数的中位数
C.拥有汽车数的方差 D.变异系数
(B)2.为了生成某个给定变量的总和。应该选用哪一个汇总统计量?
A.mean B.sum C.median D.mode
(B)3.假如有数据如图3/45所示,如果需要求出ABC这三个变量的均值,并且希望在有缺失值的情况下,尽可能的利用已有数据的信息求出均值。在spss中选择哪个函数可以达到要求
A. mean(abc) B.mean.2(abc)
C.mean2(abc) D.(a+b+c)/3
4.在图形菜单中,重新做出3.6节统计图形。比较这两种绘制统计图形的方法的异同点。
5.指出均值,众数,中位数这3个描述数据中心趋势的指标的区别及优缺点
是数据中心趋势的主要度量指标。均值容易受极端值影响
众数反应了这组观测值的集中趋势,不受极端值影响
中位数受极端值影响较小,在具有极大或极小的数据中,中位数比均值往往更能代表数据的集中趋势。
6.说明茎叶图和直方图的区别,如果想尽可能展示原始数据的信息,应该采用哪一种图形?
茎叶图是描述定量变量的一种图形方式,它除了能够给出直方图所出的分布的信息以外,还能够还原大部分原始数据的信息
应选择茎叶图
7说明帕累托图和直方图的区别。
帕累托图是按照从高到低顺序排列条形图的长方形条后形成的一种特殊条形图,最高的长方形在左边
直方图可以直观地观测数据的分布情况。
8.指出哪种衡量中心趋势的指标是以用来描述下列属性,如果有两个以上的指标都可以,请指出哪个指标可以反映最多的信息量?
A.姊妹和兄弟的个数。 (众数,中位数,均值)
B.驾驶的汽车类型 (众数)
C.父亲的体重 (均值,中位数)
D.每年休假的天数(均值,中位数,众数)
9.对于上题的四个变量,它们分别可以用下面哪种统计图来描
A条形图,帕累托图
B条形图,帕累托
C直方图
10.某公司的少数管理层员工有特别高的工资,大部分员工拿的工资很低。如果你代表员工去和公司老板谈判涨工资,那么你倾向于采用哪一个统计指标来说明员工的工资低?(众数)而如果你是老板,你倾向于采用哪一个统计指标来说明工人的工资已经很高了?(均值)
11.箱图可以探测出数据中的异常值。对数据DisRese sav进行描述性统计分析,通过箱图分析数据中是否存在异常值。