数据质量分析
主要检查原始数据中是否存中脏数据:
- 缺失值
- 异常值
- 不一致的值
- 重复数据及含有特殊符号的数据
缺失值
处理方式:删除、插补、不处理
异常值
- 简单统计量分析
- 3σ原则
- 箱型图分析
数据特征分析
- 分布分析
定量或定性分析,一般用直方图,饼图等
- 对比分析
- 统计量分析
1)集中度
2)离中度
- 周期性分析
- 贡献度分析
- 相关性分析
来源:CSDN
作者:Sin_Geek
链接:https://blog.csdn.net/lyh03601/article/details/103284089