CVPR 2019 | 告别低分辨率网络,微软提出高分辨率深度神经网络HRNet
我爱计算机视觉曾经两次报道HRNet: 1. CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法 ( 论文出来第二天就向大家推送解读了 ) 2. 分割、检测与定位,高分辨率网络显神威!这会是席卷深度学习的通用结构吗? (HRNet扩展版应用) 事实证明该论文的确影响力很大,已经出现了基于HRNet的工作发布于arXiv。 本文来自 微软研究院AI头条,为论文第一作者自己的解读,希望对大家有帮助。 编者按: 对于视觉识别中的区域层次和像素层次问题,分类网络(如ResNet、VGGNet等)学到的表征分辨率比较低,在此基础上恢复的高分辨率表征空间区分度仍然不够强,使其在对空间精度敏感的任务上很难取得准确的预测结果。为此,微软亚洲研究院视觉计算组提出高分辨率深度神经网络(HRNet),对网络结构做了基础性的改变,由传统的串行连接高低分辨率卷积,改成并行连接高低分辨率卷积,通过全程保持高分辨率和对高低分辨率表征的多次信息交换来学到丰富的高分辨率表征,在多个数据集的人体姿态估计任务中取得了最佳的性能。 前言 视觉识别主要包括三大类问题:图像层次(图像分类),区域层次(目标检测)和像素层次(比如图像分割、人体姿态估计和人脸对齐等)。最近几年,用于图像分类的卷积神经网络成为解决视觉识别问题的标准结构,比如图1所示的LeNet-5