全信息自然语言理解方法论课件.ppt
《全信息自然语言理解方法论课件.ppt》由会员分享,可在线阅读,更多相关《全信息自然语言理解方法论课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、自然语言理解与全信息理论方法论的探讨及应用,钟义信北京邮电大学智能研究中心yxzhongieee.org,NLP-NLU,NLP:对自然语言所进行的任何有意义的操作。NLU:为了理解自然语言而进行的各种操作。,NLP 是实现NLU的手段,NLU是进行NLP的目的。,为何要特别关注NLU问题?,社会全球化:人-人多语言沟通,先进生产力:人-机自然语言沟通,NLP/NLU:方法论的困惑(1),理性主义(规则方法)基本信念:“有限语言规则覆盖无限语言现象”。然而,(1)语言现象无限丰富和动态开放,“规则有限性和 封闭性”受到质疑;有限性与可实现性(2)随着规则数量增多,可能经常产生规则之间的 矛盾冲
2、突(3)人工提取规则费时费事,机器提取规则的质量 还难以保证,NLP-NLU:方法论的困惑(2),经验主义(统计方法):基本信念:“多者为真”然而,(1)统计特性的假设(符号独立或Markov阶数固定)在实际语言现象中难以成立,先天不足(2)何谓“足够大”?即使语料库的规模很大,往往也 难以保证语料统计结构的遍历性(数据稀疏)(3)统计方法本身的“统计平均性质”,不保证实际结 果的正确性;“多者为真”信念受到挑战,出路:优势互补,理想的东西都不现实;现实的东西都不理想。理性主义和经验主义虽然在理想条件下都有无穷的威力,但都受到实际条件的限制,不可能包打天下 理性主义和经验主义恰具互补特性,于是
3、出路只有互相结合,实现优势互补。问题:怎样互补?语言学规则框架,统计学处理手段;底层统计,高层理解;多层嵌套,互动互补。,科学方法论的变迁,全信息:主体关于“事物运动状态及其变化方式”的表述,包括“状态-方式”的形式、内容和价值的表述。,现代科学:信息科学、系统科学、认知科学、智能科学,现代科学方法论特点:(1)信号与信息,(2)形式与内容(3)客观与主观,(4)确定与不定(4)分解与综合,(6)局部与整体,现代科学方法论意义:二元科学 三元科学;物质结构能量转换 信息机制 分解分析方法 分合互动方法,系统:相互作用的要素的有机整体;整体大于部分和,自然语言是认识论信息(而不是本体论信息)的载
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 自然语言 理解 方法论 课件

链接地址:https://www.31ppt.com/p-4038563.html