机器学习概述
python基础的准备及pip list截图 (1)测试anaconda (2)Python环境及pip list截图 视频学习笔记 bilibili: https://www.bilibili.com/video/BV1Tb411H7uC?p=1 P1 机器学习概论 机器学习中建模过程 数据处理 特征工程 模型选择 寻找最佳超参数 模型分析与模型融合 数据预处理方法 数据清洗:数据清洗的目的是清除错误点,冗余点和数据的噪声。 数据集成:将多个数据源中的数据进行合并,形成一个统一的表格。 数据变化:找到数据的特征表示,用维度变换来减少有效的数据 P4 Python基础 使用pip安装numpy、pandas、scipy、matplotlib pip install numpy -i https://pypi.douban.com/simple 使用豆瓣仓库可以加速下载 负二项分布 称随机变量 服从参数为 的负二项分布,如果 其中 是正整数, , . 负二项分布的概率恰好是 的泰勒级数的项,分布因此得名.负二项分布亦称为帕斯卡分布,是几何分布的推广.伯努利试验恰好出现r次成功所需要的次数,服从参数为 的负二项分布. 我们的程序的随机变量进行了一个变化 . 什么是机器学习,有哪些分类? (1)什么是机器学习 让机器从数据中学习,进而得到一个更加符合现实规律的模型