情感分析(课堂ppt)课件.ppt
《情感分析(课堂ppt)课件.ppt》由会员分享,可在线阅读,更多相关《情感分析(课堂ppt)课件.ppt(57页珍藏版)》请在三一办公上搜索。
1、1,情感分析,Sentiment Analysis,2,背景互联网(如博客和论坛)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。潜在的用户可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。,3,情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion mining),情感挖掘(Sentiment mining),主观分析(Subjectivity analysis),它是对带有情感色彩的
2、主观性文本进行分析、处理、归纳和推理的过程。如从评论文本中分析用户对“数码相机”的“变焦、价格、大小、重量、闪光、易用性”等属性的情感倾向。,4,正面与负面评价?,5,6,7,8,使用twitter预测股市,9,情感分析主要目的是识别用户对事物或人的看法、态度。参与主体主要包括:(1)Holder (source)of attitude:观点持有者(2)Target (aspect)of attitude:评价对象(3)Typeof attitude:评价观点set of types:Like, love, hate, value, desire,etc.simple weightedpola
3、rity:positive, negative, neutral Textcontaining the attitude:评价文本,一般是句子或整篇文档,10,从挖掘的对象(数据)来讲,又可以分为文档级别,句子级别和短语(词)级别三大类。,11,按照处理文本的类别不同,分为基于新闻评论的情感分析和基于产品评论的情感分析。前者处理的文本主要是新闻评论,如情感句“他坚定地认为台湾是中国不可分割的一部分”,表明了观点持有者“他”对于事件“台湾归属问题”的立场;后者处理的主要是网络在线的产品评论文本,如“Iphone6s的外观很时尚”,表明了对评价对象“Iphone6s的外观”的评价“时尚”是褒义的。
4、,12,情感分析的难以程度:Simplest task:Is the attitude of this text positive or negative?More complex:Rank the attitude of this text from 1 to 5Advanced:Detect the target, source, or complex attitude types,13,情感分析的一般框架,14,情感信息抽取是情感分析的最底层的任务,它旨在抽取情感评论文本中有意义的信息单元。其目的在于将无结构化的情感文本转化为计算机容易识别和处理的结构化文本,继而供情感分析上层的研究和应
5、用服务。,15,情感信息分类则利用底层情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒、贬两类或者其他更细致的情感类别(如喜、怒、哀、乐等).按照不同的分类目的,可分为主客观分析和褒贬分析;按照不同的分类粒度,可分为词语级、短语级、篇章级等多种情感分类任务。,16,1. 评价词语的抽取和判别评价词语又称极性词、情感词,特指带有情感倾向性的词语。评价词语在情感文本中处于举足轻重的地位。主要有基于语料库的方法和基于词典的方法。,17,基于语料库的方法:评价词语抽取和判别主要是利用大语料库的统计特性,观察一些现象来挖掘语料库中的评价词语并判断极性;基于词典的方法:评价词语抽取及判别
6、方法主要是使用词典中的词语之间的词义联系来挖掘评价词语。,18,2. 评价对象的抽取评价对象是指某段评论中所讨论的主题,具体表现为评论文本中评价词语所修饰的对象,如新闻评论中的某个事件/话题或者产品评论中某种产品的属性(如“屏幕”)等。,19,基于规则/模板的方法:规则的制定通常要基于一系列的语言分析与预处理过程,如词性标注、命名实体识别、句法分析等;将评价对象看作产品属性的一种表现形式(如对数码相机领域而言,“相机的大小”是数码相机的一个属性,而“相机滑盖”是数码相机的一个组成部分),继而考察候选评价对象与领域指示词(如“整体-部分”关系,指示词“has”)之间的关联度来获取真正的评价对象。
7、,20,3. 观点持有者抽取观点持有者的抽取在基于新闻评论的情感分析中显得尤为重要,它是观点/评论的隶属者,如新闻评论句“我国政府坚定不移的认为台湾是中国领土不可分割的一部分”中的“我国政府”。命名实体识别技术序列标注知识图谱,21,4.组合评价单元的抽取单独的评价词语存在一定的歧义性,如评价词语“高”在以下 3 个句子中的使用: Sen 1:Mac的价格真高. Sen 2:华为手机的性价比相当高. Sen 3:姚明有2米多高.,22,4.1 主观表达式的抽取主观表达式(subjective clues)是指表示情感文本单元主观性的词语或词组。评价词语是主观表达式的一部分。某些词语的组合(如
8、get out of here)也能很明显地标识文本的主观性。,23,4.2 评价短语的抽取评价短语表现为一组连续出现的词组,不同于主观表达式,该词组往往是由程度副词和评价词语组合而成,如“very good”等。因此,这种组合评价单元不仅顾及了主观表达式的情感极性,还考察了其修饰成分。这些修饰成分或加强或减弱或置反了主观表达式的情感极性,使得评价短语成为一种情感色彩丰富的组合评价单元。,24,4.3 评价搭配的抽取评价搭配是指评价词语及其所修饰的评价对象二者的搭配,表现为二元对评价对象,评价词语,如情感句“这件衣服价格很高”中的“价格-很高”。“主观表达式”和“评价短语”主要是考察含有情感极
9、性的一些词和短语,然而其并非真正地表现出情感极性。如情感句 “车跑得好快啊”中的词语“好”并不存在情感极性,需要过滤掉。此外,还有一些“主观表达式”和“评价短语”存在一定的歧义,其极性需要根据上下文而确定。,25,情感信息的分类任务可大致分为两种:一种是主、客观信息的二元分类;另一种是主观信息的情感分类,包括最常见的褒贬二元分类以及更细致的多元分类。1)主客观信息分类;2)主观信息情感分类;3)观点分类与挖掘4)情感信息检索与归纳,26,主客观信息分类情感文本中夹杂着少量客观信息而影响情感分析的质量,需将情感文本中的主观信息和客观信息进行分离。由于情感文本单元表现格式比较自由,区分主、客观文本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 情感 分析 课堂 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-2008159.html