情感分析

情感分析

▼魔方 西西 提交于 2019-12-02 23:34:06
情感分析 本教程源代码目录在 book/understand_sentiment ,初次使用请您参考 Book文档使用说明 。 # 背景介绍 在自然语言处理中,情感分析一般是指判断一段文本所表达的情绪状态。其中,一段文本可以是一个句子,一个段落或一个文档。情绪状态可以是两类,如(正面,负面),(高兴,悲伤);也可以是三类,如(积极,消极,中性)等等。情感分析的应用场景十分广泛,如把用户在购物网站(亚马逊、天猫、淘宝等)、旅游网站、电影评论网站上发表的评论分成正面评论和负面评论;或为了分析用户对于某一产品的整体使用感受,抓取产品的用户评论并进行情感分析等等。表格1展示了对电影评论进行情感分析的例子: 电影评论 类别 在冯小刚这几年的电影里,算最好的一部的了 正面 很不好看,好像一个地方台的电视剧 负面 圆方镜头全程炫技,色调背景美则美矣,但剧情拖沓,口音不伦不类,一直努力却始终无法入戏 负面 剧情四星。但是圆镜视角加上婺源的风景整个非常有中国写意山水画的感觉,看得实在太舒服了。。 正面 表格 1 电影评论情感分析 在自然语言处理中,情感分析属于典型的文本分类问题,即把需要进行情感分析的文本划分为其所属类别。文本分类涉及文本表示和分类方法两个问题。在深度学习的方法出现之前,主流的文本表示方法为词袋模型BOW(bag of words),话题模型等等;分类方法有SVM(support

情感分析资源大全(语料、词典、词嵌入、代码)

匿名 (未验证) 提交于 2019-12-02 23:34:01
  如果引用到下列语料、词典等数据,出于尊重作者的学术成果,在文章中还请引用相关的文献。 1 语料库 1.1 谭松波-酒店评论语料-UTF-8,10000条   下载地址为:谭松波-酒店评论语料-UTF-8,10000条 1.2 SemEval-2014 Task 4数据集 下载地址为: SemEval-2014 Task 4数据集 1.3 Citysearch corpus 下载地址:Citysearch corpus 1.4 BeerAdvocate 1.5 NLPCC2014评估任务2_基于深度学习的情感分类 下载地址:NLPCC2014评估任务2_基于深度学习的情感分类 1.6 NLPCC2013评估任务_中文微博观点要素抽取 下载地址:NLPCC2013评估任务_中文微博观点要素抽取 1.7 NLPCC2013评估任务_中文微博情绪识别 下载地址:NLPCC2013评估任务_中文微博情绪识别 1.7 NLPCC2013评估任务_跨领域情感分类 下载地址:NLPCC2013评估任务_跨领域情感分类 1.8 NLPCC2012评估任务_面向中文微博的情感分析 下载地址:NLPCC2012评估任务_面向中文微博的情感分析 1.9 康奈尔大学影评数据集 下载地址:康奈尔大学影评数据集 1.10 MPQA 下载地址:MPQA 1.11 Twitter Comments 下载地址

keras 情感分析的例子

匿名 (未验证) 提交于 2019-12-02 22:56:40
例子1 from numpy import array from keras.preprocessing.text import one_hot from keras.preprocessing.sequence import pad_sequences from keras.models import Sequential from keras.layers import Dense from keras.layers import Flatten from keras.layers.embeddings import Embedding # define documents docs = ['Well done!', 'Good work', 'Great effort', 'nice work', 'Excellent!', 'Weak', 'Poor effort!', 'not good', 'poor work', 'Could have done better.'] # define class labels labels = array([1,1,1,1,1,0,0,0,0,0]) # integer encode the documents vocab_size = 50 encoded_docs = [one_hot(d, vocab_size) for d

结合工程实践选题调研分析同类软件产品

安稳与你 提交于 2019-11-30 21:45:30
我的工程实践选题是文本情感分析,文本情感分析又称意见挖掘、倾向性分析等。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。互联网(如博客和论坛以及社会服务网络如大众点评)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。 这些软件的开发者是怎么说服你(陌⽣⼈)成为他们的⽤户的?他们的⽬标都是盈利么?他们的⽬标都是赚取⽤户的现⾦么?还是别的? 这方面的应用目前还没有大量普及,目前百度,阿里,新浪微博等等都有这个功能,他们的目标主要是分析某样产品或者是事件的评论的情感倾向,方便人们做出决策,然后通过付费的方式来达到盈利的目的。 这些软件是如何到你⼿⾥的(邮购,下载,互相拷⻉、在线使用……) 上述的软件都是在线使用的。 这些软件有Bug 么?⼜是如何更新新版本的? 目前大多数的软件只能达到对于简单句子的分析,对于复杂情况还是得不到很好的效果,比如使用成语典故,比喻拟人等等形式。版本的更新应该是在网站的后台服务器上。 此类软件是什么时候开始出现的,同⼀类型的软件之间是如何竞争的? 发展趋势如何? 这类软件是最近几年才出现的,竞争的方式我觉得还是通过算法的精确程度和可靠的服务

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

生来就可爱ヽ(ⅴ<●) 提交于 2019-11-28 08:15:26
说起这个暑期档的动画片,非《哪吒之魔童降世》莫属了! 上映第 1 天:89分钟,中国动画最快破 1亿纪录 上映第 2 天:中国影史首部单日票房破 2亿的动画电影 上映第 4 天:中国影史第66部破 10亿影片 上映第 8 天:正式登顶!破 16亿,超过《疯狂动物城》,创中国影史动画电影票房新纪录 上映第 9 天:成为中国影史第 17 部破 20亿 影片 上映第 10 天:破 23亿!连续10天单日票房过亿,连续10天获得单日票房冠军 而,最令人振奋的是,猫眼给出的最终票房预测已经飙到 44.87亿! 不仅仅是票房,《哪吒》在豆瓣上的评分也到了 8.6 分以上(《大圣归来》的豆瓣评分是 8.3 分),众多影迷观看后给出的评价也非常直观,就是好看二字。 那么,这部动画,到底大家对其评价如何? 大量票房背后的数据里又隐藏了哪些东西? 本文抓取了猫眼 20W+ 的短评,并进行了简单的数据分析,带大家一起看下,观众的真实想法。 一、电影总体评价如何? 猫眼电影的评分为 0-10 分,从上图可以看到,有 97.3% 的观众给出了 8 分以上的高分,给出满分 10 分的更是达到了 85%。 只有极小一部分观众(1%)打了 4 分以下的低分。 总体来说,观众还是很喜欢这部电影的,票房好的同时,口碑也好,名利双收! 二、总体评价的时间走向如何? 下面来分析一下自首映以来的每天的评分变化趋势。