DL--交叉验证
Wikipedia: https://en.wikipedia.org/wiki/Cross-validation_(statistics) 交叉验证 (有时称为 旋转估计 [1] [2] [3] 或 样本外测试 )是各种类似的 模型验证 技术中的任何一种,用于评估 统计 分析的结果将如何推广到一个独立的数据集。它主要用于设置,其目的是预测,和一个想要估计如何 准确地 一个 预测模型 在实践中执行。在预测问题中,通常会给模型一个 已知数据的数据集 ( 训练数据集 )和一个 未知数据 的数据集(或 首先 测试的数据),然后针对该数据测试模型(称为 验证数据集 或 测试集 )。 [4] [5] 交叉验证的目的是测试模型预测未用于估计其数据的新数据的能力,以发现诸如 过度拟合 或 选择偏差之类的问题 [6] ,并对如何进行建模提供深刻见解。该模型将推广到一个独立的数据集(例如,未知数据集,例如来自实际问题的数据集)。 一轮交叉验证涉及 分割 一个 样品 的 数据 到 互补 的子集,在一个子集执行所述分析(称为 训练集 ),以及验证在另一子集中的分析(称为 验证集合 或 测试集 )。为了减少 可变性 ,在大多数方法中,使用不同的分区执行多轮交叉验证,并将验证结果组合(例如取平均值)在各轮中,以估计模型的预测性能。 总之,交叉验证结合(平均