信息检索概论(续2).ppt
《信息检索概论(续2).ppt》由会员分享,可在线阅读,更多相关《信息检索概论(续2).ppt(43页珍藏版)》请在三一办公上搜索。
1、第二讲 信息检索基础,一、信息检索学科内容二、文献的类型及其特点三、检索工具,第一节 信息检索学科内容,一、理论基础 信息检索作为计算机应用的一个分支,它的学科体系包括以下几个部分:(1)数学 高等数学、线形代数(矩阵论)、概率论(随机过程)、统计学、模式识别、离散数学等。,理论基础(续),(2)计算机科学 高级程序设计语言(C/C+)、算法与数据结构、数据库系统、软件工程、信息系统、计算机网络、人工智能(机器学习)等。(3)计算语言学,包括自然语言处理等(4)信息科学 信息论、文献学、分类与聚类、信息资源管理等。,二、研究代表人物,信息检索研究主要代表人物,也就是萨尔顿奖得主。IR领域最著名
2、的奖项莫过于Gerald Salton奖,这个奖项由SIGIR(信息检索特别兴趣小组)每三年颁发一人次,颁给那些在IR领域持续地做出卓越贡献的大家们。所以Salton奖项得主是我们学习信息检索应关注的主要对象。下面分别予以介绍。,1.W.Bruce Croft(克罗夫特),Salton奖2003年度得主,现代信息检索的大家,与James P.Callan(坎伦)等开发了著名的INQUERY检索系统。W.B.Croft是美国麻省大学计算机科学系的杰出教授。,2、Stephen Robertson(斯蒂芬 罗伯荪),2000年度Salton奖得主,现代概率IR模型的创始人之一,开发了著名的OKAP
3、I概率检索系统,该系统在TREC(Text Retrieval Conference文本检索会议,SMART测试系统)评测中屡屡获得好成绩。Robertson原在伦敦城市大学(City University,London),现在微软剑桥研究院。,3、Tefko Saracevic(萨拉塞维克),1997年度Salton奖得主。美国著名信息科学家,早期从事信息检索教学,后来从事信息检索研究。出生在克罗地亚,现在供职于美国Rutgers大学Communication,Information and Library Studies学院。,4、William Cooper(威廉 库珀),1994年度S
4、alton奖得主。IR中引入概率的先驱。供职于Univ.of California,Berkeley.,5、Cyril Cleverdon(克来弗登),1991年度Salton奖得主。著名的Cranfield 项目负责人,著名的信息检索测试系统。生前供职于英国伦敦The Institute of Information Scientists。,6、Karen Sparck Jones(琼斯),1988年度Salton奖得主。现代概率IR模型的另一创始人。在自然语言处理(NLP)、IR等领域都颇有建树,而且做了大量的组织性工作。现在供职于英国剑桥大学计算机学院。,7、Gerard Salton(
5、索尔顿,1927-1995),1983年度首届Salton奖得主,Salton就是以他名字命名。现代信息检索的奠基人。著名的IR向量空间模型(Vector Space Model)的创始人,开发了著名的SMART向量空间模型IR系统并免费开放源代码下载,大大促进了IR的发展。生前供职于美国康奈尔大学计算机系。,Salton奖项得主毕竟凤毛麟角,还有很多研究人员为IR做出了卓越贡献,Keith van Rijsbergen(赖吉斯博根)英国格拉斯哥大学。概率IR的逻辑推理学派代表人出版了著名的IR经典教材 INFORMATION RETRIEVAL(Second Edition),有电子版可以下
6、载。Susan Dumais(苏珊 杜迈斯),LSI(Latent Semantic Indexing)的创始人。1997年加盟微软研究院美国总部。,三、核心刊物和教材,1、刊物(1)Information Processing and Management(IP&M)信息处理与管理(2)Journal of American Society for Information Science and Technology(JASIST)美国信息科学与技术学会杂志,刊物(续),(3)Communication of ACM(CACM)美国计算机协会通讯(4)Journal of Documenta
7、tion(JoD)文献杂志(5)Journal of the ACM(JACM)美国计算机协会杂志,2、教材,(1)Baeza-Yates,R.&Riberio-Neto.(1999)Modern Information Retrieval,Brazil:Addison-Wesley-Longman Publishing Company.Available:URL.Last accessed 1 November 2002,教材(续),(2)Van Rijsbergen,C.J.(1979)Information Retrieval.2nd ed.Glasgow:University of G
8、lasgow.Chapters 1&2 Available:URL Ch.1.html.Last accessed 1 November 2002(3)Information Retrieval:Data Structures and Algorithms.Edited by William B.Frakes and Ricardo Baeza-Yates.Prentice-Hall,1992 ISBN:0-13-463837-9,教材(续),(4)Lancaster,F.W.,Information Retrieval Systems:Characteristics,Testing and
9、Evaluation,Wiley,New York(1968).(5)李国辉等.信息组织与检索.北京:科学出版社,2002,第二节 文献的类型及特点,文献的划分有不同的标准,依据不同的标准,可以划分出不同的类型。1按文献载体划分:纸本式手(写型文献、印刷型文献)缩微型 声像型 机读型(磁带、磁盘、光盘),一次文献:原始文献。期刊、图书、论文二次文献:对无序的一次文献有序化,揭示其外部、内容特征。书目、索引、题录。三次文献:利用二次文献,选用一次文献,分析综合而成。综述、述评零次文献:准文献。尚未发表或不适合公开和大范围交流。底稿、手稿、口头交流,2按文献加工程度划分,一次文献,文献整理,二次文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 概论
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5926471.html