网络信息检索课件09版检索原理和搜索引擎A.ppt
《网络信息检索课件09版检索原理和搜索引擎A.ppt》由会员分享,可在线阅读,更多相关《网络信息检索课件09版检索原理和搜索引擎A.ppt(59页珍藏版)》请在三一办公上搜索。
1、课件制作:张胜光,第二章 检索原理和搜索引擎,网络信息检索第2章 张胜光制作,3,本章内容,第一节 信息检索原理:关键词匹配原则,网络信息检索第2章 张胜光制作,5,1、从“图灵实验”说起,大家都知道,计算机发展史上有一个重要人物图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。他并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。,网络信息检索第2章 张胜光制作,6,2、计算机检索的奥妙:关键词匹配,计算机既然如此“无能”,连三岁小孩的智能都不具有,那么为什么人们要在网上查找信息,却总
2、要通过计算机帮忙呢?计算机检索的奥妙在哪里呢?原来,计算机实现检索的奥妙,就在于它能把你输入的检索词,与它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。,网络信息检索第2章 张胜光制作,7,广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。,狭义的信息检索:一个匹配(Match)过程 即用户使用检索语言对自己的信息需求予以描述,并在一定的信息资源系统中进行描述匹配的过程。,3、什么是信息检索?,网络信息检索第2章 张胜光制作,8,存 储,检 索,原始文献,加工整理,数据库,提 问,检 索,输 出,“爱因斯坦论
3、文”,“论文”,“爱因斯坦”,“论文”,“爱因斯坦”,网络信息检索第2章 张胜光制作,9,4、信息检索原理,检索提问式,信息的选择与收集,信息特征,标识语言,检索工具匹配,检索结果,信息源,用户,信息需求,检索提问,数据库,网络信息检索第2章 张胜光制作,10,What?Where?How?,5、信息检索的要领,网络信息检索第2章 张胜光制作,11,6、信息检索类型,依信息存储和检索的方式手工检索(Manual Retrieval)也叫传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。计算机检索(Camputer-based Retrieval)也叫现代信息检索,是指利用计算机和网络
4、来处理和查找文献信息的检索方式。,网络信息检索第2章 张胜光制作,12,7、主要计算机检索系统类型,检索系统由一定的检索设备(计算机)和经过加工整理并存储在相应载体上的信息集合及其他设备共同构成的具有存储和检索功能的信息服务系统。联机检索(online search)脱机检索(offline search)光盘检索(CD search)网络检索(Internet/Web search)全球数字图书馆系统(digital global system),网络信息检索第2章 张胜光制作,13,8、“关键词原则”是信息检索的根本原则,四次文献,三大系列中文网站,两类搜索引擎,Keyword原则,第二节
5、 搜索引擎的原理和发展概况,网络信息检索第2章 张胜光制作,15,1、网络信息资源种类,WWW信息资源:web网页FTP信息资源:远程计算机上的文件夹Blog信息资源:博客、播客等等信息资源Telenet信息资源:直接调用远程主机BBS、新闻组信息资源:相当于论坛信息P2P信息资源:私人计算机上的信息资源数据库和收费网站:如三大库三大馆,网络信息检索第2章 张胜光制作,16,2、网络信息资源的特点,信息量大、传播广泛信息类型多样、内容丰富信息时效性强、变化频繁信息分散无序、但关联程度高信息缺乏管理、良莠不齐 所以在网络信息检索中,我们常常要借助于搜索引擎来帮助我们“大海里捞针”。,网络信息检索
6、第2章 张胜光制作,17,搜索引擎Search EngineInternet网络信息检索工具,3、搜索引擎的概念,网络信息检索第2章 张胜光制作,18,4、搜索引擎的发展历史,网络信息检索第2章 张胜光制作,19,搜索引擎发展历史,第三代搜索网页搜索,网络信息检索第2章 张胜光制作,20,搜索引擎的起源Archie,所有搜索引擎的祖先,是1990年由蒙特利尔的McGill University三名学生发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,
7、但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。,网络信息检索第2章 张胜光制作,21,由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。现在这个工具主要用在国外大型图书馆的信息检索上。,早期的另一个搜索工具Gopher,网络信息检索第2章 张胜光制作,22,1994年4月,
8、斯坦福大学的两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!-几乎成为20世纪90年代的因特网的代名词。,第二代搜索:目录式搜索 Yahoo!,网络信息检索第2章 张胜光制作,23,1995年,一种新的搜索引擎形式出现了元搜索引擎(Meta Search Engine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个
9、预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。,好听不好用的元搜索引擎,网络信息检索第2章 张胜光制作,24,第三代搜索:网页搜索,它们都属于网页自动搜索引擎,有的还带有智能分析或FTP、P2P搜索功能,网络信息检索第2章 张胜光制作,25,5、搜索引擎的工作原理,网络信息检索第2章 张胜光制作,26,网络信息检索第2章 张胜光制作,2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索 课件 09 原理 搜索引擎

链接地址:https://www.31ppt.com/p-6374064.html