虽然我也粗读过统计学的几本书,但从易懂性来说,都没有学校老师给的ppt好,或者说自己看书比较困难,但是听老师讲课就很容易懂。所以,我建议有条件的同学能够选修统计学这门课,没条件的同学可以去网上找一些相关视频,配套书籍可以选择茆诗松的《概率论与数理统计》。另外,《Head First Statistics》一书可以用来预热。
学了统计学,你至少应该知道:
- 基本的抽样方法
- 数据分布的描述统计量有哪些?一组样本数据分布的数值特诊可以从三个方面进行描述:
- 描述水平的统计量:
- 数据的水平:也称为集中趋势或位置度量,反应全部数据的数值大小。
- 均值、中位数、分位数、众数
- 描述差异的统计量
- 数据的差异:反应数据间的离散程度。
- 极差和四分位差、方差和标准差、变异系数、标准分数
- 描述分布形状的统计量
- 分布的形状:反应数据分布的偏度和峰度。
- 偏度系数、峰度系数
- 描述水平的统计量:
- 你需要了解一些重要的分布,比如正态分布、chi-square分布、t分布、F分布等。
- 假设检验是用来做什么的、置信区间的概念、MSE (Mean Squared Error)均方误差、RMSE(Root Mean Squard Error)均方根误差、MAE(平均绝对误差)、R-squared(拟合优度)的含义等等。
- 怎样进行数据预处理
- 怎样整理和显示数据
- 你需要了解各种图的作用和适用场景,常用图包括条形图、饼图、直方图、折线图、箱线图、散点图、雷达图等