学习曲线
来源:https://www.cnblogs.com/volcao/p/9291551.html 一、基础理解 学习曲线作用 : 查看模型的学习效果; 通过学习曲线可以清晰的看出模型对数据的过拟合和欠拟合; 学习曲线 :随着训练样本的逐渐增多,算法训练出的模型的表现能力; 表现能力 :也就是模型的预测准确率,使用均方误差表示;学习率上体现了模型相对于训练集和测试集两类数据的均方误差。 具体的操作: len(X_train) 个训练样本,训练出 len(X_train) 个模型,第一次使用一个样本训练出第一个模型,第二次使用两个样本训练出第二个模型,... ,第 len(X_train) 次使用 len(X_train) 个样本训练出最后一个模型; 每个模型对于训练这个模型所使用的部分训练数据集的预测值:y_train_predict = 模型.predict(X_train[ : i ]); 每个模型对于训练这个模型所使用的部分训练数据集的均方误差:mean_squared_error(y_train[ : i ], y_train_predict); 每个模型对于整个测试数据集的预测值:y_test_predict = 模型.predict(X_test) 每个模型对于整个测试数据集的预测的均方误差:mean_squared_error(y_test, y_test