R语言:数据分析
一、数据分析概述
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。
(一)数据分析的原则
- 数据分析是为了验证假设的问题,需要提供必要的数据验证。分析模型构建完成后,需要利用测试数据验证模型的正确性。
- 数据分析是为了挖掘更多的问题,并找到深层次的原因,并针对可能的原因进行实际运用及跟踪结果再分析。
- 进行数据分析之前要明确数据分析针对的问题,然后带着问题进行数据分析。
(二)数据分析的步骤
- 探索性数据分析
对于从多种渠道获得的大量杂乱无章、看不出规律的数据,需要在没有多少经验的情况下第一次对其进行仔细的分析。探索性数据分析能够在这种情况下帮助找到所有这些数据中隐含的信息。 - 模型选定分析
在探索性分析的基础上,通过定量分析方法,提出一类或几类可能的模型,然后通过进一步的分析,从中挑选一类合适的模型。 - 推断分析
通常使用数理统计方法,进行一系列的计算和分析,对所确定的模型或估计的可靠程度和精确程度做出推断。
(三)数据分析的过程
(四)数据分析的对象
- 关系型数据库、事物型数据库、面向对象的数据库
- 数据仓库/多维数据库
- 空间数据
- 工程数据
- 文本和多媒体数据
- 时间相关的数据
- 万维网(HTML、XML)
二、大数据分析
(一)大数据分析的流程
相比于传统的数据处理,大数据时代的数据处理的理念有三大显著的转变:
- 数据是全体的而不是抽样的
- 分析要的是效率而不是绝对精确
- 分析的结果要的是相关性而不是因果性
大数据处理流程:
(二)大数据分析的基本方面
越来越多的应用涉及大数据,这些大数据的属性、数量、速度和多样性等都呈现了数据不断增长的复杂性。
- 预测性分析能力
- 数据质量和数据管理
- 可视化分析
- 语义引擎
- 数据分析挖掘算法
(三)大数据分析的应用
- 理解和定位客户
- 理解和优化业务流程
- 金融交易
- 在此次武汉疫情中,大数据也在寻找传染源和分析疑似人群方面起到了关键性的作用
三、数据分析常用工具
Excel、SPSS、MATLAB、R
来源:CSDN
作者:姚巨龙
链接:https://blog.csdn.net/weixin_43645790/article/details/104115533