数据挖掘中所需的概率论与数理统计知识、上
数据挖掘中所需的概率论与数理统计知识、上 ( 关键词:微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布 ) 导言 :本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文 第4节 ( 彻底 颠覆以前读书时大学课本灌输给你的观念 ,一探正态分布之神秘芳踪,知晓其前后发明历史由来 ),相信,每一个学过概率论与数理统计的朋友都有必要了解 数理统计学简史 ,因为,只有了解各个定理.公式的发明历史,演进历程.相关联系,才能更好的理解你眼前所见到的知识,才能更好的运用之。 前言 一个月余前,在 微博 上感慨道,不知日后是否有无机会搞DM,微博上的朋友 只看不发的围脖 评论道:算法研究领域,那里要的是数学,你可以深入学习数学,将算法普及当兴趣。想想,甚合我意。自此,便从 rickjin 写的“正态分布的前世今生”开始研习数学。 如之前微博上所说,“ 今年5月接触DM,循序学习决策树.贝叶斯,SVM.KNN,感数学功底不足,遂补数学,从‘正态分布的前后今生’中感到数学史有趣,故买本微积分概念发展史读,在叹服前人伟大的创造之余,感微积分概念模糊,复习高等数学上册,完后学概率论与数理统计,感概道:微积分是概数统计基础,概数统计则是DM&ML之必修课 。”包括读者相信也已经感觉到,我在写这个 Top 10 Algorithms in Data