本文是对论文的解读和复现。
论文地址:https://arxiv.org/abs/1408.5882
一、论文
在预先训练的词向量上训练卷积神经网络(CNN)用于句子级分类任务的实验。证明了一个简单的CNN,它只需要很少的超参数调整和静态向量,就可以在多个基准上获得很好的结果。通过微调学习特定于任务的向量可以进一步提高性能。本文讨论的CNN模型改进了7项任务中的4项,包括情感分析和问题分类。
1.introduce
近年来,深度学习模型在计算机视觉(Krizhevsky et al.,2012)和语音识别(Graves et al.,2013)方面取得了显著的效果。在自然语言处理中,许多使用深度学习方法的工作涉及通过神经语言模型学习词向量表示(Bengio等人,2003;Yih等人,2011;Mikolov等人,2013)和对学习到的词向量进行构图以进行分类(Collobert等人,2011)。
词向量,就是将单词经由隐藏层,从稀疏编码(大小为V,V是词汇表长度)投影到低维向量空间。词向量本质上是对单词的语义特征进行维度编码的特征提取器。在这种稠密的表示中,语义相近的词在低维向量空间中的欧几里德距离或余弦距离上同样相近。
卷积神经网络(CNN)利用带卷积滤波器的层,作用
于局部特征(LeCun等人,1998)。CNN模型最初是为计算机视觉而发明的,后来被证明对NLP有效,并在语义分析(Yih等人,2014)、搜索查询检索(Shen等人,2014)、句子建模(Kalchbrenner等人,2014)和其他传统NLP任务(Collobert等人,2011)方面取得了优异的结果。
来源:https://www.cnblogs.com/liuxiangyan/p/12512644.html