cyclegan

(DeepLearning Classification)Bengali.AI Handwritten Grapheme Classification

痴心易碎 提交于 2020-04-06 15:17:51
Bengali.AI Handwritten Grapheme Classification 1st Place Solution — Cyclegan Based Zero Shot Learning 第一名的工作真的是Impressive , 我还是第一次见到GAN应用到数据增强方向, 严格来讲也不算是是数据增强; Data 比赛的任务是对孟加拉语的手写字进行识别; 孟加拉语由三个部分组成: 168*字根( grapheme root), 11*元音 (vowel diacritic), 7*辅音 (consonant diacritic) 每张手写图片的大小是137 x 236 ; 在训练集中的大小是: 200840 Public A的大小是: 36 其中, Private test的数据中有可能出现train中没有出现过的手写字, 但是168个字根,11个元音,7个辅音在训练集中全部出现过了; 所以这有一点zero-shot的感觉. Model 思路最重要的依据在于, 将测试的数据分为两部分: 一部分为见过的数据(Seen), 一部分为没见过的数据(Unseen); 那么怎么将数据划分为见过和还是没见过的呢? 作者通过设置一个Out of distribution CNN模型,输出1295个置信度, 如果所有的置信度都低于设定的超参数阈值, 那么认定为Unseen;