数据分析
数据分析是使用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形式结论,并加以详细研究和概括总结的过程
数据分析的目的在于,将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据,以找出研究对象的内在规律
在统计学领域中,数据分析可以划分为如下三类:
描述性数据分析:从一组数据中,可以摘要并且描述这份数据的集中和离散情形
探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设
验证性数据分析:验证科研假设测试所需的条件是否达到,以保证验证性分析的可靠性
数据分析的应用场景
数据分析的流程 :
Pyhton做数据分析的优势 :
1.语法简单精炼,适合初学者
2.拥有一个巨大且活跃的科学计算社区
3.拥有强大的通用编程能力
4.人工智能时代的通用语言
5.方便对接其他语言
Anaconda的介绍
Anaconda 是一个提供python开发所需的工具包,包括python/IPython/CPython/Conda等180个依赖项,同时支持 Linux,Mac,Windows三大平台
Anaconda是一个可以便捷获取和管理包,同时对环境可以统一管理的发行版本
Anconda的特点 :
包含了众多流行的科学、数学、工程和数据分析的Python库
完全开源和免费
对于学术用途,可以申请免费的License
全平台支持Linux、Windows、Mac OS X
Conda的介绍
Anaconda集成了常用的扩展包,能够方便地对这些扩展包进行管理,比如安装和卸载包,这些操作都需要依赖conda
Conda是一个在Windows、Mac OS和Linux上运行的开源软件包管理系统和环境管理系统,可快速地安装、运行和更新软件包及其依赖项
Anaconda的使用
Miniconda的介绍
它是最小的conda安装环境,只包含最基本的Python与conda以及相关的必须依赖项。对于空间要求严格的用户,Miniconda是一种选择,它只包含了最基本的库,其它的库需要自己手动安装
常见的数据分析工具
练习题
来源:CSDN
作者:挽歌亽朽年
链接:https://blog.csdn.net/ghf183184/article/details/104450985