0942152116-彭灿《嵌入式系统及应用》大作业模版.docx
《0942152116-彭灿《嵌入式系统及应用》大作业模版.docx》由会员分享,可在线阅读,更多相关《0942152116-彭灿《嵌入式系统及应用》大作业模版.docx(32页珍藏版)》请在三一办公上搜索。
1、0尔敏斯华冷例ANHlIXINHUAUZlVERSlTY嵌入式系统及应用(大作业)(题目:基于S3CC400的嵌入式Web服务器BOa移植)姓名:彭灿学号:0942152116专业:院系:电子通信工程学院指导老师:完成时间:2013年10月8日基于看法挖掘的中文词汇语义倾向性分析摘要近年来随着互联网的快速发展,网络已经成为人们表达民意的重要场所,网络评论也已经成为政府和企业等单位了解民意和消费者需求倾向的一个重要途径,网民言论将对政府在内的各类社会组织发挥前所未有的影响力。通过对这类网络评论进行分析,政府可以了解网民对公众事务的看法,企业可以依据评论改进产品质量和服务。如何处理这些信息从中得到
2、他们想要的内容,在近年来得到了很多的关注和探讨。其中情感分析就是随之兴起的一个探讨领域,可以应用到信息过滤、产品举荐和用户爱好发掘等方面。本文针对基于看法挖掘的中文词汇语义倾向性分析主要做了以下工作:(1)主要介绍看法挖掘的相关概念,并对目前的国内外探讨现状做了一个深度的介绍。(2)介绍目前词汇语义倾向性计算中比较常用的两种算法,分别对它们的优缺点进行分析。(3)介绍自己的探讨方法和相关过程。本文主要针对热点新闻事务中的评论数据进行收集,然后利用中科院分词软件TCTC1.AS对收集到的评论数据进行分词,将它们看成一段段的短文本,抽取其中的关键词(一般以形容词、副词居多),与事先打算好的情感语料
3、库进行对比,提出语义倾向相像度的概念,通过对PMl算法和HowNet算法计算词语的倾向性的优缺点进行分析,提出一种改进的基于看法挖掘的中文词汇语义倾向性分析方法。从而为相关部门针对这些问题实施新的政策供应更好的决策支持。关键词:看法挖掘;情感倾向性;文本倾向性分析;情感分析BasedOnAnalysisOfChinese1.exicalSemanticTendentiousnessOpinionMiningABSTRACTWiththerapiddevelopmentofthenetwork,Internethasbecomeanimportantplacewherepeoplecouldex
4、presstheiropinions.Internetcommentingalsobecameavitalmethodwherethegovernmentandenterprisesgetpeoplesopinionsandcustomers,needtendencywhichwillmakegreatandimmeasurableimpactsonthegovernmentandallkindsofsocialorganizations.Thegovernmentcangettoknownetizens,viewofpublicaffairs,andenterprisescanadjusta
5、ndpromotetheirproductsqualityandafterservicesthroughtheanalysisofcommentspostedonline.Inrecentyears,moreandmoreresearcheshavefocusedonthetopicabouthowtofilerandselectinformationtheyneed.Andemotionanalysisisoneofthoseresearcheswhichcouldbeappliedininformationfiltering,productsrecommending,userinteres
6、tdevelopingandmanyotheraspects.ThispaperisaresearchconcentratingontheanalyzingofthetendencyofChinesewordsbasedoncommentdiscovering.Thepaperismainlyabout:1. Basicconceptsaboutcommentdiscovering,andadeepintroductionaboutrelatedresearchesbothfromChinaandforeigncountries.2. Anintroductiontotwobasiccalcu
7、latingmethodsinpresentcalculationsofwordstendency,andtheanalysisofadvantagesanddisadvantagesofthesetwomethods.3. Anintroductiontothemethodandprocessofmyownresearch.Thispapermainlyfocusesondatacollectedfromhotcurrenteventscomments,whichwillbeanalyzedwithTCTC1.ASsoftwarefromChineseAcademyofSciencesand
8、putthemintoshorttexts.Itwillselectsomeofthekeywords(mostlyadjectivesandadverbs),makeacomparisonwiththewordsfromemotionlexiconpreviouslypreparedandcomeupwithasimilarconcepttowordtendency.AndthroughtheanalysisofadvantagesanddisadvantageswiththehelpofPMIandHowNet,itwillgetamoreadvancedmethodtotheanalyz
9、ingofwordstendencybasedoncommentdiscovering,sothatitcanproviderelevantofficeswithbettersupportandsolutionstoproblemsfromthelaunchingofnewpolicies.Keywords:Commentdiscovering;Emotiontendency;Analysisoftexttendency;Amotionanalysis1绪论错误!未定义书签。第一章ARM体系结构介绍错误!未定义书签。1.1ARMcore描述错误!未定义书签。1.2编程模型介绍错误!未定义书签。
10、1.2.1ARM处理器模式错误!未定义书签。1. 2.2ARM寄存器组介绍错误!未定义书签。ARM存储系统错误!未定义书签。其次章Bootloader的概念错误!未定义书签。2. 1Bootloader的基本概念错误!未定义书签。2. 2Bootloader的操作模式错误!未定义书签。第三章Bootloader的设计与实现错误!未定义书签。2.1 课题探讨的平台环境错误!未定义书签。硬件平台错误!未定义书签。软件环境以及软件开发工具错误!未定义书签。3. 2Bootloader的总体设计错误!未定义书签。阶段设计错误!未定义书签。地址规划设计错误!未定义书签。模式设计错误!未定义书签。3. 3
11、Bootloader的具体实现错误!未定义书签。阶段1的代码实现错误!未定义书签。阶段2的代码实现错误!未定义书签。代码的编译错误!未定义书签。目标文件的链接与转换错误!未定义书签。第四章试验结果与测评错误!未定义书签。3.1 试验结果错误!未定义书签。基本功能的实现结果错误!未定义书签。扩展功能的实现结果错误!未定义书签。第五章总结与展望错误!未定义书签。致谢错误!未定义书签。1绪论11.1 选题背景和探讨意义21.2 国内外看法挖掘探讨现状31.3 本文主要探讨内容41.4 本文的主要结构52看法挖掘及其相关探讨方法62.1 看法挖掘与情感分析62.1.1 看法挖掘62.1.2 情感分析6
12、2.2 相关探讨方法介绍62.2.1 PMI算法72.2.2 HowNet的算法83数据的预处理及语义倾向相像度探讨方法93.1 数据的预处理93.2 评价对象的抽取93.3 方法的原理和流程93.3.1 词汇的表示和选择103.3.2 语义倾向相像度的描述和计算11333词汇语义倾向识别方法134试验及结果分析154.1 对试验数据的分析154.2 试验结果比较164.3 情感词典的建设175结论19致谢20参考文献21附录241绪论随着互联网的快速发展和普及,网络已成为人们日常生活、学习和消遣的重要组成部分。互联网包含了各种专业学问和商务信息的新闻报道、各种类别各种形式的信息,为用户供应了
13、一个极有价值的信息来源。然而在面对网络中如此错综困难的信息时,人工处理这些数据量将花费大量的时间和精力,所以我们须要在多种智能信息处理方法的帮助下,自动从大量数据中挖掘有价值的信息。情感分析主要是针对用户评论中的主观性文本自动获得有价值的看法信息,是一个特别具有前景的探讨方向。情感分析技术可被广泛应用于多种自然语言处理问题中,如:问答系统、信息抽取系统等。同时,情感分析也产生了很多有挑战性的相关子方向。例如:文本主客观分析,旨在识别文本单元的主客观性;情感分类,旨在识别主观文本单元是褒义、中性还是贬义等。本文致力于探讨评论性的情感句中的评价对象选取以及组成情感句的短文本的倾向性推断任务。该任务
14、可分为两个主要阶段:(1)如何提取这些情感句中的评价对象;(2)如何判别组成情感句的这些短文本的情感倾向性。例如:对于某一评论“这款手机的待机时间很长,但是功能太少。系统首先提取出评论中的评价对象(如:“待机时间”和“功能”),然后结合修饰评价对象的评价词语(如:长,少),通过与现有的情感语料库进行对比,给出两个评价对象的相应情感倾向性,即“待机时间,长”一“电池寿命,褒义”,“功能,少”一“功能,贬义二关于评价对象的获得,已有的方法大致可以归为两类:一种是对类似于像新浪微博这类的探讨对象要抽取里面关于某条微博中的全部评论,可以采纳申请API的方法来获得全部评论数据;另一种则是对像新浪新闻这类
15、的新闻类网站的评论,我们主要采纳手工获得,即把全部用户的评论数据通过人工的方式采集起来,放到一起组成一个试验资料库。人工获得的缺点在于须要大量人力,且可移植性较差;自动获得的缺点在于只是针对特定的内容(如新浪微博、腾讯微博这类可以申请API的)才可以用到。鉴于本文选取的探讨对象是新浪新闻其中的某一条,评论数据量不大,所以我们获得数据的方式主要采纳人工获得。目前关于评价对象的倾向性推断主要包括有指导和无指导这两类方法。有指导方法主要是Kim和Hovy运用词、位置以及情感词三类特征来对情感句进行分类;赵军等人运用CRF和冗余标签对句子序列进行情感倾向性标注,有指导方法的缺陷在于须要人工标注大量语料
16、,不利于领域切换。无指导方法目前主要是基于句法规则的方法,这类方法的优点在于能够精确的描述情感词和评价对象之间的修饰关系,缺点在于各种修饰关系须要人工统计,导致召回率不高。MinqingHu和Bing1.iu基于句子的情感词以及上下文信息来判定倾向性,但他们的方法主要处理英文,系统中的部分技术无法干脆向中文移植,同时有以下两类问题没有很好的解决,一是句子中褒、贬情感词数目相同,二是含有上下文相关情感词的句子。鉴于以上方法的不足,本文运用无指导方法进行评价对象抽取和倾向性分析。在评价对象抽取上,首先运用中文分词软件ICTC1.AS对评论句进行中文分词,然后运用基于句法分析技术的评价对象抽取方法,
17、同时加入三种过滤技术。在倾向性分析阶段,将情感句分为四类,采纳分治策略对各类别情感句制定相应的判定规则,从而完成评价对象的倾向性判定。1.1 选题背景和探讨意义互联网的快速发展使得人们表达自己的观点越来越自由。在网络中,人们可以通过门户网站对特定的内容进行评论。而这些评论数据对相关部门了解民意方面有着很重要的作用,如可以依据网民的反馈状况制定新的政策等等。由于现有技术的局限性,综合分析网络评论仍旧存在很大困难。网络评论产生的数据量是巨大的,人工查看这些信息和统计数据,这明显是低效和不切实际的。如何有效地利用这些评论和看法,以使其更好地为相关部门服务是当前探讨的热点之一。本文主要探讨中文词汇语义
18、倾向性分析技术,通过引入语义倾向相像度的概念,提出了一种基于语义倾向相像度的中文词汇语义倾向性分析方法。该方法首先通过短语模式对词汇表达情感的实力进行评估,选择出候选词汇,避开了客观词汇对识别结果的影响,并且大大减小了计算量;然后,引入词汇的语义倾向相像度的概念,通过词汇间的四种连接关系计算词汇的语义倾向相像度;最终,对单个词汇的语义倾向性进行识别,进而完成情感词典的构建。试验结果表明,与通用的SO-PMl算法和基于HOWNet的方法相比,本方法具有较好的识别性能,并且便于情感词典的扩展。1.2 国内外看法挖掘探讨现状国外从20世纪90年头中期就起先普遍关留看法挖掘方面的探讨,探讨的方法主要有
19、这几种:1.基于机器学习的传统文本分类技术。2002年BoPang运用了常用的机器学习技术,如朴实贝叶斯(NaiVeBaye)最大端、支持向量机(SUPPOrtVectorMachine)等对文本进行情感倾向分类,改进的机器学习方法随后也被接连提出,例如K-近邻(KNN)、NB、简洁线性分类器(S1.C)、C4.5决策树等,这些算法都是基于统计理论的,采纳分析词语间的相像度或文档中的词频数,利用监督学习方法,统计出相关类别中词语的出现频率或概率,然后依据目标文本中相关词语的频度信息判别出其情感类别。2 .基于集合的方法,利用词共现(CO-OCeUrrenCe)的统计检验方法。这种方法起先涉及到
20、了词语的语义,2002-2003年Turney提出了基于词共现的非监督文本分类算法:SO-PMI(SemanticOrientationusingPointwiseMutualInformation)#So-1.SA,其理论假设是依据自然语言文本里的一个现象:语义倾向性越相像的两个词,在同一篇文档中共现的概率越大,此后有人改进了基于SO-PMI算法以其他的探讨还有。基于词典的方法。例如利用WOrdNet(中文HoWNet)等来推断词语的情感倾向。3 .其他方法:模糊集方法1,潜在变量模型(1.VM)方法U*电子自旋模型方法【等。2004年Kim和HoVy对看法挖掘中的“看法(OPiniOn)”
21、做了定义叫随后,HU和1.iU引入特征级看法挖掘,1.iU等人探讨这个问题从正向、反向观点短语中提取特征。2007年Popescu和Etzioni提出了一种无监督的方法(OPlNE)并与1.iU的探讨作了比较U%国内针对看法挖掘的探讨起步较晚,但是也陆接连续有一些探讨成果发表。2004年FeiZhongchao等通过分析文本中词的词性组成进行文本情感倾向的推断,702006复旦高校朱嫣岚等人利用HowNet来计算词汇情感倾向的两种方法:一种是基于HoWNet语义相像度的方法,另外一种是基于语义相关的方法,其试验结果表明,在相同的测试集上,第一种方法要比其次种方法的精确率高。2006年Qiang
22、Ye等通过改进的SO-PMI方法对中文电影评论进行了情感倾向分类口纥2006年BinShi等改进了文献中的方法,提出了一种手工建立“特征-情感”词汇模型,依照这个模型来分析句子,先识别出情感词,然后依据情感词找出隐藏的特征词。2007年唐慧丰等人对各种基于有监督机器学习方法的中文情感倾向分类问题做了比较,结果表明:采纳BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的状况下,情感分类能取得较好的效果31。2007年徐琳宏等人提出了一种基于语义理解的识别机制,首先计算文本中词汇与HowNet中已标注褒贬性词汇间的相像度,获得词汇的倾向性,再选择语
23、义倾向性明显的词汇作为特征值,用SVM分类器分析文本的褒贬性2008年QiSU等探讨了产品特征与语义词汇之间的隐含关系,提出了一种无监督机器学习方法来建立“特征-情感词汇”关系模型,用来识别隐含的特征-情感词汇关系【22。2008年ChangliZhang等利用基于StringKernel的机器学习方法对中文文档进行情感分类囚】。2008年李钝等从词典中对词语语义定义的特点,采纳“情感倾向定义”权重有限的计算方法获得短语中各词的语义倾向度,然后分析短语中各词组合方式的特点,提出中心词概念来对各词的倾向性进行计算来识别短语的倾向性和倾向强度口】。2008年FengHou等探讨了带有比较性质的语句
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嵌入式系统及应用 0942152116 彭灿 嵌入式 系统 应用 作业 模版
链接地址:https://www.31ppt.com/p-7101935.html