统计学是一种利用数学理论来进行数据分析的技术。通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作。利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构,如何能够以最佳的形式来应用其它相关的技术以获取更多的信息。数据统计分析也是基于统计学的基础进行的,由此可见数据统计分析的重要性,下面我将介绍数据统计分析的基本概念和数据统计分析表分类。
数据统计分析基本概念
一、特征统计
特征统计可能是数据科学中最常用的统计学概念。它是你在研究数据集时经常使用的统计技术,包括偏差、方差、平均值、中位数、百分数等等。理解特征统计并且在代码中实现都是非常容易的。
二、概率分布
我们可以将概率定义为一些事件将要发生的可能性大小,以百分数来表示。在数据科学领域中,这通常被量化到0到1的区间范围内,其中0表示事件确定不会发生,而1表示事件确定会发生。
三、过采欠采
过采样具有与多数分类相同的样本数量。副本将被制作成保持少数分类的分布。欠采样多的使用样本少的分类样本。这种选择应该是为了保持分类的概率分布。
四、降维维数
降维这个术语可以很直观的理解,意思是降低一个数据集的维数。在数据科学中,这是特征变量的数量。
统计分析表分类
缺陷位置调查表
若要对产品各个部位的 缺陷情况进行调查,可将产品的 草图或展开图画在调查表上,当某种缺陷发生时,可采用不同的符号或 颜色在发生缺陷的部位上标出。
不合格品统计调查表
所谓不合格品,是指不能满足质量标准要求的产品。不合格品统计调查表用于调查产品质量发生了哪些不良情况及其各种不良情况的比率大小。
频数分布调查表
频数分布调查表是预先制好的一种 频数分布空白表格。该表应用于以产品质量特性值为计量值的工序中,其目的是为了掌握这些工序产品质量的分布情况,比直方图更为简单。
数据统计分析的应用,加快了数据最终分析的速率,以数据分析的角度而言,统计数据分析相当于整个过程的先锋。针对企业级的商业智能而言,掌握有利的数据统计分析能力,便拥有了市场的主动权,国内企业所用的BI工具,大多是Finebi,本土化的智能分析软件,更适应国内特有的复杂环境,有着更好的发展空间。
来源:https://blog.csdn.net/hualalalalali/article/details/99547487