帕累托

数据特征—帕累托分析

ぐ巨炮叔叔 提交于 2020-03-09 10:11:24
帕累托分析(贡献度分析) → 帕累托法则:20/80定律 “原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。一般来说,投入和 努力可以分为两种不同的类型: 多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。” → 一个公司,80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润 例如: ** 世界上大约80%的资源是由世界上15%的人口所耗尽的 ** 世界财富的80%为25%的人所拥有;在一个国家的医疗体系中 ** 20%的人口与20%的疾病,会消耗80%的医疗资源。 一个思路:通过二八原则,去寻找关键的那20%决定性因素! import numpy as npimport pandas as pdimport matplotlib.pyplot as plt% matplotlib inline​# 帕累托分布分析​data = pd.Series(np.random.randn(10)*1200+3000, index = list('ABCDEFGHIJ'))print(data)print('------')​# 创建数据,10个品类产品的销售额​data.sort_values(ascending=False, inplace= True)​# 由大到小排列,值的替换 plt.figure(figsize = (10,4)

2019-11-10[鞠明辰]SPSS作业

烂漫一生 提交于 2019-12-04 04:46:06
1.一个数据文件包含下列数据,5个家庭没有汽车(编码为0),20个家庭有一辆汽车(编码唯1),10个家庭拥有两辆汽车(编码为2)指出下列哪种统计量适用于描述该数据并计算出统计量的值。A A拥有汽车数的众数 B.拥有汽车数的中位数 C.拥有汽车数的方差 D.变异系数 2.为了生成某个给定变量的总和。应该选用哪一个汇总统计量?B A.mean B.sum C.median D.mode 3.假如有数据如图3/45所示,如果需要求出ABC这三个变量的均值,并且希望在有缺失值的情况下,尽可能的利用已有数据的信息求出均值。在spss中选择哪个函数可以达到要求C A. mean(abc) B.mean.2(abc) C.mean2(abc) D.(a+b+c)/3 4.在图形菜单中,重新做出3.6节统计图形。比较这两种绘制统计图形的方法的异同点。 5.指出均值,众数,中位数这3个描述数据中心趋势的指标的区别及优缺点 是数据中心趋势的主要度量指标。均值容易受极端值影响 众数反应了这组观测值的集中趋势,不受极端值影响 中位数受极端值影响较小,在具有极大或极小的数据中,中位数比均值往往更能代表数据的集中趋势。 6.说明茎叶图和直方图的区别,如果想尽可能展示原始数据的信息,应该采用哪一种图形? 茎叶图是描述定量变量的一种图形方式,它除了能够给出直方图所出的分布的信息以外,还能够还原大部分原始数据的信息

spss课后习题

别说谁变了你拦得住时间么 提交于 2019-12-04 04:46:05
1.一个数据文件包含下列数据,5个家庭没有汽车(编码为0),20个家庭有一辆汽车(编码唯1),10个家庭拥有两辆汽车(编码为2)指出下列哪种统计量适用于描述该数据并计算出统计量的值:A A拥有汽车数的众数 B.拥有汽车数的中位数 C.拥有汽车数的方差 D.变异系数 2.为了生成某个给定变量的总和。应该选用哪一个汇总统计量:B A.mean B.sum C.median D.mode 3.假如有数据如图3/45所示,如果需要求出ABC这三个变量的均值,并且希望在有缺失值的情况下,尽可能的利用已有数据的信息求出均值。在spss中选择哪个函数可以达到要求:B A. mean(abc) B.mean.2(abc) C.mean2(abc) D.(a+b+c)/3 4.在图形菜单中,重新做出3.6节统计图形。比较这两种绘制统计图形的方法的异同点。 5.指出均值,众数,中位数这3个描述数据中心趋势的指标的区别及优缺点 是数据中心趋势的主要度量指标。均值容易受极端值影响 众数反应了这组观测值的集中趋势,不受极端值影响 中位数受极端值影响较小,在具有极大或极小的数据中,中位数比均值往往更能代表数据的集中趋势。 6.说明茎叶图和直方图的区别,如果想尽可能展示原始数据的信息,应该采用哪一种图形? 茎叶图是描述定量变量的一种图形方式,它除了能够给出直方图所出的分布的信息以外

2019年11月10日 SPSS 运飞龙

别来无恙 提交于 2019-12-04 04:44:44
1.一个数据文件包含下列数据,5个家庭没有汽车(编码为0),20个家庭有一辆汽车(编码唯1),10个家庭拥有两辆汽车(编码为2)指出下列哪种统计量适用于描述该数据并计算出统计量的值。A A拥有汽车数的众数 B.拥有汽车数的中位数 C.拥有汽车数的方差 D.变异系数 2.为了生成某个给定变量的总和。应该选用哪一个汇总统计量?C A.mean B.sum C.median D.mode 3.假如有数据如图3/45所示,如果需要求出ABC这三个变量的均值,并且希望在有缺失值的情况下,尽可能的利用已有数据的信息求出均值。在spss中选择哪个函数可以达到要求D A. mean(abc) B.mean.2(abc) C.mean2(abc) D.(a+b+c)/3 4.在图形菜单中,重新做出3.6节统计图形。比较这两种绘制统计图形的方法的异同点。 5.指出均值,众数,中位数这3个描述数据中心趋势的指标的区别及优缺点 是数据中心趋势的主要度量指标。均值容易受极端值影响 众数反应了这组观测值的集中趋势,不受极端值影响 中位数受极端值影响较小,在具有极大或极小的数据中,中位数比均值往往更能代表数据的集中趋势。 6.说明茎叶图和直方图的区别,如果想尽可能展示原始数据的信息,应该采用哪一种图形? 茎叶图是描述定量变量的一种图形方式,它除了能够给出直方图所出的分布的信息以外,还能够还原大部分原始数据的信息

帕累托分析

别来无恙 提交于 2019-11-27 12:35:18
帕累托分析(贡献度分析) → 帕累托法则:20/80定律 “原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。 一般来说,投入和努力可以分为两种不同的类型: 多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。” → 一个公司,80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润 例如: 世界上大约 80% 的资源是由世界上 15% 的人口所耗尽的 世界财富的80%为25%的人所拥有;在一个国家的医疗体系中 20% 的人口与 20% 的疾病,会消耗 80% 的医疗资源。 一个思路:通过二八原则,去寻找关键的那20%决定性因素! import numpy as np import pandas as pd import matplotlib.pyplot as plt % matplotlib inline # 帕累托分布分析 data = pd.Series(np.random.randn(10)*1200+3000, index = list('ABCDEFGHIJ')) print(data) print('------') # 创建数据,10个品类产品的销售额 data.sort_values(ascending=False, inplace= True) # 由大到小排列 plt.figure(figsize = (10,4)