欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    基于词典的中文情感倾向文本分析工具.ppt

    • 资源ID:5696401       资源大小:205KB        全文页数:20页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于词典的中文情感倾向文本分析工具.ppt

    基于词典的中文情感倾向文本分析工具,情感倾向可认为是主体对某一客体主观存在的内心喜恶,内在评价的一种倾向。情感倾向方向情感倾向度,情感倾向,目前,情感倾向分析的方法主要分为两类:基于情感词典的方法;是基于机器学习的方法。,分析方法,文本情感分析的分析粒度:词语;句子;段落;篇章。,分析粒度,解决较短文本的情感分析,篇章级文本情感分析的基础。,分析粒度,句子级的情感倾向分析:,使用工具:语言:java中文分词系统:FudanNLP-1.5情感词典:知网情感词典,语言和工具:,1、文本切割转换,算法分析,3、情感聚合,2、情感定位,将文档D以换行符”/n”分割成段落P;将段落P用中文里常用的句号、分号、问号、感叹号划分句意的符号,切割成不同的句子“。”,”;”,”?”,”!”;使用FudanNLP中的分词函数,对短句进行分词。,1、文本切割转换,文本切割的目的是将文本变成我们后续分析需要的格式:“我今天很不高兴。”(1,“我”,“代词”),(2,“今天”,”时态词”),(3,“很”,”副词”),(4,“不”,”否定词”),(5,“高兴”,“形容词”),1、文本切割转换,2、情感定位,单词列表,是否为情感词,否,next,标记并存入情感词列表,next,是,否定词的修饰会使情感词语的情感极性发生改变。多重否定:当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思。否定词典NotDict,并设置其权值为W=-1。,常见的否定词如:不、没、无、非、莫、弗、毋、勿、未、否、别、無、休,否定词和程度副词的优化,“我今天很不高兴”,当程度副词修饰情感词,该情感词的情感倾向程度发生了变化。,否定词和程度副词的优化,“今天坐了12个小时的车,身体极度疲惫。”,type|权值超|over 1.5很|very 1.25极其|extreme/最|most 2较|more 1.2欠|insufficiently 0.5稍|slightly 0.8,程度副词示例,经过文本切割转换(1,“我”,“代词”),(2,“今天”,“时态词”),(3,“很”,“副词”),(4,“不”,“否定词”),(5,“高兴”,“形容词”)情感定位(5,“积极词”,4),(4,“否定词”,-1),(3,“程度词”,1.25),“我今天很不高兴。”,篇章级情感倾向通过聚合篇章中所有的句子的情感倾向来计算得出。句子级由句子中所含情感词来计算。,3、情感聚合,情感值=否定词(-1)*程度词权重*情感词权重,“我很不高兴”分词之后:我 很 不 高兴“我不很高兴”分词之后:我 不 很 高兴,否定词和程度词位置关系,W=1;If 位置(否定词)位置(程度词):W=-1;意群情感值=W*程度词权重*情感词权重;endIf 位置(否定词)位置(程度词):W=0.5;意群情感值=W*程度词权重*情感词权重;end 如果句子里出现多个否定词,则处理办法为:For n in 所有否定词:W=-1*W,3、情感聚合,句子情感值=sum(意群情感值1,意群情感值2)段落情感值=average(句子1情感值,句子2情感值)文档情感值=average(段落1情感值,段落2情感值),3、情感聚合,最后可以通过整个文章的情感值的正负号以及权值大小来判断情感倾向是积极的还是消极的。,小 结,Thank you,

    注意事项

    本文(基于词典的中文情感倾向文本分析工具.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开