机器学习入门
机器学习 针对经验 E 和一系列任务 T 和一定表现的衡量 P ,如果随着经验 E 的积累,针对定义好的任务 T 可以提高其表现 P ,则说明机器有学习能力 S klearn 库 基本使用 包含了所有机器学习算法 ——> 分类 回归 非监督分类 数据降维 数据预处理 1. 构建机器学习模型 A. 逻辑回归 B. 支持向量机 C. 决策树 D. 神经网络 在给定的数据上做解决分类的问题 导入样本数据 代码: from sklearn import datasets wine = datasets.load_wine() print(wine) 补充: y 是样本的标签!每个分类的个数是类似的,所以不会存在不平衡的问题! 通过 numpy 包的 shape() 方法输入 data 和 target 的大小: 代码: import numpy as np print(np.shape(x),np.shape(y)) 其中, (178,13)---- 代表 178*13 的矩阵【意思是 178 个样本,每个样本有 13 个特征(或 13 个特征矩阵)】 (178,) ----- 代表长度是 178 的一个一维向量 把数据分成训练数据和测试数据 ----- 搭建模型后用一种机制评估模型 代码: from sklearn.model_selection import train_test