数据分析概括
数据分析 数据分析是使用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形式结论,并加以详细研究和概括总结的过程 数据分析的目的在于,将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据,以找出研究对象的内在规律 在统计学领域中,数据分析可以划分为如下三类: 描述性数据分析:从一组数据中,可以摘要并且描述这份数据的集中和离散情形 探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设 验证性数据分析:验证科研假设测试所需的条件是否达到,以保证验证性分析的可靠性 数据分析的应用场景 数据分析的流程 : Pyhton做数据分析的优势 : 1.语法简单精炼,适合初学者 2.拥有一个巨大且活跃的科学计算社区 3.拥有强大的通用编程能力 4.人工智能时代的通用语言 5.方便对接其他语言 Anaconda的介绍 Anaconda 是一个提供python开发所需的工具包,包括python/IPython/CPython/Conda等180个依赖项,同时支持 Linux,Mac,Windows三大平台 Anaconda是一个可以便捷获取和管理包,同时对环境可以统一管理的发行版本 Anconda的特点 : 包含了众多流行的科学、数学、工程和数据分析的Python库 完全开源和免费 对于学术用途,可以申请免费的License 全平台支持Linux、Windows、Mac