2018-文本分类文献阅读总结
文章 1 Generative and Discriminative Text Classification with Recurrent Neural Networks 时间: 2017 机构:Google DeepMind 生成模型: generative 判别模型: discrimination 作者支持生成模型比判别模型具有更加优异的性能,经过生成模型和判别模型的建模给出结论。 判别模型使用 LSTM 的变体(增加了 peephole 到每一个门上,则每一个门都会受到上一节点的 cell 的影响),当给定了文本类别标签后最大化条件概率: P ( y|x;W,V ) 生成模型是基于类的语言模型,命名为共享 LSTM ,通过类别 class 来共享参数,包括:词向量矩阵 V , LSTM 参数 W , softmax 参数 U 。新颖之处,这样会产生一个条件模型,这个模型可以通过给定标签的词向量来共享参数;而在传统的生成模型中,每一个标签都有一个独立的 LM 。 文中的生成模型和判别模型具有很多相似性,不同的是体现在训练的过程中,生成模型要最大化联合概率: 实验: 数据集:来源:http://goo.gl/JyCnZq ,资源包括: 新闻分类,情感分析, Wikipedia 文章分类,问答文本 数据列表: 基线 model : Na¨ıve Bayes classifier