无监督机器翻译Word Translation without Parallel Data
无监督机器翻译一 机器翻译 Word Translation without Parallel Data 基线方法 相似性度量方法 对抗训练 改进 结果比较 无监督模型选择的验证标准 机器翻译 目前主流的机器翻译模型都是有监督的,本文主要介绍无监督机器翻译。Facebook某课题组在无监督机器翻译方面发表了四篇论文,四篇论文一脉相承,层层深入,前一篇都是后一篇的基础,对于无监督机器翻译的学习有很大的帮助。今天先介绍第一篇,下面是这四篇论文的标题链接: Word Translation without Parallel Data - ICLR’18 Unsupervised Machine Translation Using Monolingual Corpora Only - ICLR’18 Phrase-Based & Neural Unsupervised Machine Translation - EMNLP’18 Cross-lingual Language Model Pretraining Word Translation without Parallel Data 文章前后脉络有些乱,其实仔细阅读发现文中主要是用无监督方法和有监督方法做对比,有监督方法又叫基线方法,文中叫Procrustes,该方法和三种相似度度量方法(NN、ISF、CSLS