cs224u Overview of the Stanford Sentiment Treebank
cs224u Overview of the Stanford Sentiment Treebank 本文有几个相互关联的目标: •针对长期以来一直是学术研究和行业应用核心的问题:情感分析,提供监督学习的基本介绍。 •探索和评估一系列不同的情感建模方法: ◾线性分类器手工构建特征函数 ◾从VSMs中导出的特征表示 ◾递归神经网络 ◾树结构神经网络 •讨论和实施超参数优化和分类器评估与比较的方法。 本文围绕美国斯坦福大学情绪树库(SST)构建,SST是一个广泛用于评估有监督NLU模型的资源,它提供了丰富的语言表示。 情感分析的深度学习( https://nlp.stanford.edu/sentiment/ ):这个网站提供了一个预测电影评论情感的演示。大多数情感预测系统的工作原理是孤立地看单词,给积极的单词加上积极的点,给消极的单词加上消极的点,然后总结这些点。这样就忽略了词序,丢失了重要信息。相反,我们新的深度学习模型实际上建立了一个基于句子结构的完整句子表示。它根据单词如何构成较长短语的意思来计算情感。这样,模型就不像以前的模型那么容易被愚弄了。例如,我们的模型了解到幽默和诙谐是积极的,但以下句子总体上仍然是消极的:这部电影实际上既没有那么有趣,也没有超级诙谐。这个演示的底层技术是基于一种新型的递归神经网络,它建立在语法结构之上。你也可以浏览斯坦福情感树库