面向自动文摘的主题划分方法课件.ppt
《面向自动文摘的主题划分方法课件.ppt》由会员分享,可在线阅读,更多相关《面向自动文摘的主题划分方法课件.ppt(17页珍藏版)》请在三一办公上搜索。
1、面向自动文摘的主题划分方法,童毅见 2012-11-4,主题的概念,1,主题的定义现状:鲜有确切的关于主题的定义。2,几个关于“主题”的定义Labadi认为主题是会话或讨论的主要问题Chafe主题是正在讨论的命题所谓“主题”,是介于篇章与段落之间的一个语言单位,一个主题表达或阐述一个相对独立的意义或话题3,本文对主题的定义主题是用来描述一个话语片段所表达内容的一种直观方式,该话语片段阐述了一个相对独立的意义或话题。主题不应是一个语言单位,但是可以通过篇章集、段落集或句子集的方式呈现。,主题划分,1,主题划分的概念主题划分就是将一个含有多个主题的话语(在本文中以文本方式体现)切分成一系列单个主题
2、。Reynar认为,作者在写作前,会在脑海中收集一些没有连接的主题,在写作过程中为了保证文本的流畅,会有意无意的设置一些主题边界2,主题划分的分类主题划分可以分为层次划分(hierarchical segmentation)和线性划分(linear segmentation)从划分结果来看,线性划分还可以进一步分为连续划分和非连续划分,主题划分对自动文摘的意义,1,有助于平衡摘要的结构,提高摘要的覆盖面 如果采用传统的基于句子重要度从高到低抽取的方法,很容易造成对次要主题的遗漏或忽略,并且容易导致主要主题的冗余。2,主题特征对自动文摘的促进作用 Louis.et al.在比较话语结构特征、语义
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 自动 文摘 主题 划分 方法 课件
链接地址:https://www.31ppt.com/p-4068077.html