PReMVOS论文理解
文章目录 本文创新点\贡献 方法 Image Augmentation Proposal Generation Proposal Refinement Mask Propagation using Optical Flow ReID Embedding Vectors Proposal Merging 实验结果 总结 本文创新点\贡献 效果最好,但也最麻烦,用了很多的预训练操作 方法 使用目标检测网络来代替检测ROI,以此来获得一个粗到的目标推荐,然后只在裁剪并resize的bbox上做分割,再用聚合算法结合物体分数,光流,Re-ID特征嵌入向量,空间约束,对第一帧的每个物体进行追踪,最终根据追踪分数来做mask Image Augmentation 每个video使用第一帧的ground truth生成2500个增强的图片,使用的 Lucid Data Dreaming方法,只是生成单个图片,将物体裁剪出来,随机加上背景,然后微调这些数据,效果会更好 Proposal Generation 使用Mask RCNN来生成粗糙的目标推荐,将网络设置成了类别未知,将N类别换成了1类别,通过将所有的类别映射到一个单一的前景类别来检测一般的物体 只要识别有没有就行了,不管分类,应该能更好的抓取物体 从COCO和Mapillary上得到预训练权重ImageNet