计算机视觉中的半监督学习
作者:Amit Chaudhary 编译:ronghuaiyang 原文链接: 计算机视觉中的半监督学习 mp.weixin.qq.com 导读 图解半监督的各种方法的关键思想。 计算机视觉的半监督学习方法在过去几年得到了快速发展。目前最先进的方法是在结构和损失函数方面对之前的工作进行了简化,以及引入了通过混合不同方案的混合方法。 在这篇文章中,我会通过图解的方式解释最近的半监督学习方法的关键思想。 1、自训练 在该半监督公式中,对有标签数据进行训练,并对没有标签的数据进行伪标签预测。然后对模型同时进行 ground truth 标签和伪标签的训练。 a. 伪标签 Dong-Hyun Lee[1] 在 2013 年提出了一个非常简单有效的公式 —— 伪标签。 这个想法是在一批有标签和没有标签的图像上同时训练一个模型。在使用交叉熵损失的情况下,以普通的监督的方式对有标签图像进行训练。利用同一模型对一批没有标签的图像进行预测,并使用置信度最大的类作为伪标签。然后,通过比较模型预测和伪标签对没有标签的图像计算交叉熵损失。 总的 loss 是有标签和没有标签的 loss 的加权和。 为了确保模型已经从有标签的数据中学到了足够的知识,在最初的 100 个 epoch 中,αt 被设置为 0。然后逐渐增加到 600 个 epochs,然后保持不变。 b. Noisy Student Xie