文献检索与利用教案2.ppt
《文献检索与利用教案2.ppt》由会员分享,可在线阅读,更多相关《文献检索与利用教案2.ppt(103页珍藏版)》请在三一办公上搜索。
1、2 网络信息检索基础知识,2.1 Internet 基础知识2.2 Internet提供的主要服务 2.3 长大网上图书馆 2.4 网络信息检索的基本技术2.5 计算机检索的基本原理2.6 检索效果的评价指标(在第八章中讲述),2.1 Internet 基础知识,Internet又称因特网,也称国际互联网,是全球计算机和计算机网络通过统一的网络通讯协议(TCP/IP协议)连接在一起的集合,计算机用户能够通过共享信息资源并互通信息。信息高速公路,它是由无数计算机通过通信设备相互连接而成的信息通信网。,2.1.1 Internet 发展历史,1、ARPA net的诞生 ARPA net 即美国国防
2、部的计算机网络,是Internet的先驱。20世纪60年代末期,美国兰德公司等开始试验基于离散控制和信息包交换技术的计算机网络。1968年美国国防部高级研究计划署(ARPA)开始资助这个研究项目并于1969 年秋建成具有四个节点的计算机网络-ARPA net。2、NSF net的出现 美国国家科学基金会(NSF)在1985年资助建立了连接五大超级计算机网络的计算机网络-NSF net3、现代Internet的产生 20世纪90年代。,2.1.2 Internet在中国,我国Internet技术的发展大致可分为三个阶段:第一个阶段为19871993年,一些科研部门开展了一些和Internet 联
3、网的国际科技合作连接,开通了Internet的国际电子邮件服务。第二个阶段从1994年开始,我国实现 了和Internet的TCP/IP连接,开通了Internet的全功能服务,从而使Internet在国内得到迅猛发展。,第三阶段是以Internet的商业化为标志。到 2000年止,国内已形成五大互联网络。(1)中国公用计算机互联网(China NET).由邮电部门经营管理,是我国规模最大,用户最多的ISP(即Internet服务提供商)。(2)中国科技技术网(CSTNET).(3)中国教育和科研计算机网(CERNET)由原国家教委主持建设(1994年开始建设)和管理,网络中心设在清华大学,并
4、在北京、上海、沈阳、广州、武汉、成都、南京、西安等八大城市设立了CERNET的地区网络中心。(4)中国金桥信息网(China GBN)是中国公用经济信息通信网。(5)中国联通公用计算机互联网(CNUNINET)是经国务院批准直接进行国际联网的经营网络,其拨号接入号码为“165”。,2.1.3 Internet的几个基本概念,1万维网(WWW)WWW是英文词组World Wide Web的缩写,简称3W或Web,中文名字叫万维网(万维网正是Wan Wei Wang的汉语拼音缩写,而且是一万个自由度的庞大坐标,正好影射无所不在的互联网,真是音形意兼备,这一中文叫法太完美了)。WWW 如同一本巨大的
5、书一样,也是由许多“页”组成的,只不过这些“页”分布在世界各地的我们称之为网站的服务器上,这种页面称之为网页,一般习惯把这些网站的首页称为主页。WWW把遍及全球的信息资源以网页的形式联系起来,这种联系被称为“超级链接”(Hyperlink).我们正是通过 点击这些“超级链接”来访问网站信息。,2TCP/IP 为了确保不同类型的计算机能协调工作,程序设计人员要使用标准的协议编写程序。所谓协议(Protocol)就是一组规划,其技术术语描述如何完成某件事情。TCP/IP是指一个完整的数据通信协议集,它是一族协议(100多个协议)的代名词。TCP/IP包括两个重要协议-传输控制协议TCP(Trans
6、mission Control Protocol)和网际互联协议IP(Internet Protocol),是维系Internet的基础,用于组织网络中和通信设备上的信息传输与交换。,3.IP地址与域名 在Internet中数以千万计的计算机设备连在一个计算机网络上,这些计算机在提供信息服务和通信时,是靠Internet的域名系统(DNS)和计算机的IP地址来相互识别的。,(1)IP地址 为了使加入Internet的计算机在通信时能够相互识别,网际互连IP协议规定每台正式入网的计算机都要有一个唯一的网络IP地址,这个地址由四节数字组成,每节数字的取值范围从0到 255,数字之间用点号“.”号隔
7、开,这四节数字又可细分为两个部分,一部分代表计算机网络的地址,另一部分代表网络中设备的地址。任何正式加入Internet的计算机都必须有一个全世界唯一的IP地址,就像电话局安装电话必须有唯一的电话号码一样。http:/10.203.1.13(图书馆),接入Internet的网络根据其规模大小可分为A、B、C三类。A类网络是大型网络,IP地址中的第一节表示网络地址,后三节表示网内主机地址,每个A 类网络可容纳1600多万台设备;B类网络可容纳6万多台设备,IP地址中的前两节表示网络地址,后两节表示网络主机地址;C类(小型)网络可容纳256台设备(其中:0代表本机网,255保留作网络广播,实际可容
8、纳254台设备),IP地址中的前三节表示网络地址,最后一节表示主机地址。,类别 IP地址第一组数 A 0127 B 128191 C 192223,(2)域名 用数字表达的IP地址有一个缺点就是不好记。为了解决IP地址难记的缺点,Internet采用了域名系统(Domain Name System,缩写为DNS)。根据DNS,加入Internet的每台计算机还可以有一个用英文字母表达的域名。例如:国家自然科学基金委员会与Internet联网的一台计算机的域名为:http:/其含义是:Web服务器,nsfc国家自然科学基金委员会(三级域名),gov政府机构(二级域名),cn中国(顶层域名)。,当
9、我们使用计算机的域名与Internet上的其它计算机建立通信联络时,Internet上的一种称为域名服务器的计算机,将自动完成从计算机域名到IP地址的转换。在最高层域名下,我国也将计算机网络的第二级域名分为两类:一类是按照网络所有者的性质分类的域名,如AC(科学院)、COM(商业机构)、GOV(政府机构)、ORG(社团组织)、EDU(教育机构)、INT(国际组织)、MIL(军事部门)和NET(网络服务机构)等;另一类是包括直辖市和各省(自治区)名称缩写的域名,如BJ(北京)、WH(武汉)、SH(上海)、AH(安徽)等。,4.统一资源定位符(URL)URL(Uniform Resource Lo
10、cator)是一种统一格式的Internet信息资源地址表达方法,它将Internet提供的各类服务统一编址,以便用户通过Web客户程序进行查询。URL在格式上可以分为以下三个基本部分:信息服务类型:/信息资源地址/文件路径例如 URL地址:http:/WWW/chuanyi 下的chuanyi.html。,5.超文本(Hypertext)人们把Hypertext译为“超文本”,它也是一种文本,只不过是一种非线性文本。通常我们使用的文本是线性文本,即从上到下,从左到右排列的文本。而超文本的内容是按照超级链接来组织的。在超文本中,如果读者需要更多有关某一个主题的信息,那么读者就可以很快地通过鼠标
11、单击超级链接点,来跳转到其它Web或同一页的不同位置。,6.超文本标记语言(HTML)在Hypertext文件经过HTML(Hyper Text Markup Language)的描述后不但文字内容本身有特殊的排版效果,更重要的是它改变以往平面文档的浏览方式,文档上的每一点,每一张图片都可以指向一个地方即存在链接功能。,2.1.4 Internet的接入方式1、拨号入网:要求有电话线、计算机、调制调解器(Modem)和相应的软件。Modem的工作原理就是对计算机输入/输出的信号进行调制/调解,便于信息在通信中传递。2、通过局域网入网:用户计算机通过光纤电缆连接到一个与Internet相连的局域
12、网(LAN)上。要求配备一块网络适配器以及安装相应的驱动程序,并且必须安装TCP/IP通信协议。,2.2 Internet提供的主要服务,2.2.1 电子邮件服务 Internet的电子邮件(E-mail)服务是一种通过计算机网络与其它用户进行联系的现代化通信手段。软件是Outlook Express。,2.2.2 远程登录服务(Telnet)Internet用户的远程登录是在网络通信协议Telnet的支持下,使自己的计算机暂时成为远程计算机仿真终端的过程。要在远程计算机上登录,首先应给出远程计算机的域名或IP地址。另外还必须有相应的账号和口令。一旦登录成功,用户便可实时使用远程计算机对外开放
13、的功能和资源。许多大学图书馆都通过Telnet对外提供联机检索服务。网上拷贝,则还需要FTP。FTP与Telnet类似,也是一种实时的联机服务。在进行工作时,用户首先要登录到对方的计算机上,与远程登录不同的是,登录后,用户只能进行与文件搜索和文件传送等有关的操作。即网上拷贝和从本地机将文件复制传输到远程主机(上载upload)。ftp:/10.203.1.233:90/,2.2.3 网络新闻服务(Network News)网络新闻通常又称为Net News,它是具有共同爱好的Internet用户相互交换意见的一种无形交流系统,它相当于一个全球范围的电子公告牌系统。志趣相同的用户借助网络上一些被
14、称为新闻服务器的计算机展开各种类型的专题讨论。,2.2.4 WWW信息服务WWW服务是一种基于超文本的多媒体信息服务。它的工作模式是:在Internet上的一些称为Web服务器的计算机上运行着Web服务程序,它们是信息的提供者,常常被人们称为Web网站。同时在用户的计算机上运行着各式各样的Web客户端浏览器(Browser)程序,它们是信息的读取者,帮助用户完成信息查询。,2.2.5 Gopher服务“北美地鼠”Gopher是一种基于多级菜单的交互式检索工具和信息浏览方法。最初是美国明尼苏达大学为了引导未受过培训的学生进行信息查询而开发的。Gopher将Internet上的信息组织成一种菜单式
15、的索引,可方便地通过分类方式查询到不同类型的信息资源。,网络信息资源的类型:,联机数据库联机馆藏目录电子图书电子期刊电子报纸软件与游戏教育培训信息动态性信息(如BBS、广告、网络新闻等),电子商务介绍,电子商务就是通过电子信息技术,网络互联技术和现代通(信)讯技术,使得交易涉及的各当事人借助电子方式联系,而无需依靠纸面文件、单据的传输,实现整个交易过程的电子化。,2.3 长大网上图书馆,长大图书馆主页的网址是 http:/,登录网上图书馆输入读者证号和密码初次登录时要注册,初始密码为123,初始密码:123,初次登录时进行注册,初始密码为123点击本馆读者注册,输入注册信息,点击确认增加,注册
16、成功后返回登录,登录进入,登录进入,权限查询 在这里你可以查看你目前 在图书馆所享受的服务,借阅查询在这里你可以查看你在图书馆 当前的借阅、预约情况,借阅史查询在这里你可以查看你在图书馆 以往的的借阅、预约情况,财经查询在这里你可以查看你在图书馆 发生的各类财经信息,感兴趣新书在这里你可以浏览到 你感兴趣的新书,书目查询 在这里你可以查询图书馆的馆藏书目信息,并可以预约想要借阅的书,中国:走向成功之路:建设有中国特色社会主义的思想历程 魏新生著 郑州:河南人民出版社,1994 360页 CNY7.80 D6-51/2:1 详细信息,公共书目(OPAC)查询,OPAC 是 Online Publ
17、ic Access Catalogue 的缩写,即联机公共查询目录。读者可通过 OPAC 检索利用我馆的馆藏文献资源。OPAC 也是网络上的公共资源,读者利用 OPAC 也可检索国内外其它图书馆的馆藏资源。同样,凡互联网用户利用 OPAC 也可检索我馆的文献资源。,长大图书馆数据库资源 http:/,2.4 网络信息检索的基本技术,2.4.1 WWW信息检索WWW信息检索的主要工具是搜索引擎,搜索引擎由以下三个部分组成:(1)搜索软件-网页搜索工具 Spider(蜘蛛)或Worm(虫、蠕虫)或robot(机器人),在Internet网上搜索网页信息,并把它们带回搜索引擎。(2)索引软件-将信息
18、进行分类索引建立网页数据库。(3)检索软件-通过Web服务器端软件,为用户提供浏览器界面下的信息查询。搜索引擎按语种可分为中文和西文两种。,中文搜索引擎:搜狐 http:/新浪 http:/网易 http:/雅虎中文 http:/网典 http:/http:/搜索客 http:/百度 http:/天网 http:/北极星 http:/w常青藤 http:/悠游 http:/,西文搜索引擎:http:/(中文)http:/http:/http:/http:/http:/http:/http:/,搜索引擎的检索方式有分类浏览和关键词检索两种:,分类浏览是采用层层展开的方式对www信息资源进行组织,
19、用户从各级类目中选择合适的类目。如在搜狐界面上可浏览到娱乐休闲,工商经济、旅游与交通等18大类信息。每大类下将给出若干子类.关键词检索就是在搜索引擎的检索界面上有搜索输入框,用户直接输入关键词,可返回按相关性排序的检索结果。,分类浏览 搜狐 http:/,关键词检索就是在搜索引擎的检索界面上有搜索输入框,用户直接输入关键词,2.4.2 搜索引擎的检索技巧,1、布尔逻辑检索 一般的数据库检索中所提供的布尔逻辑运算通常有三种,即AND(与)、OR(或)、NOT(非),而且大多采用命令驱动方式提供,但在搜索引擎中表现情形则大不相同:(1)受支持的程度不同,有的“完全支持”;有的“部分支持”;(2)提
20、供运算的方式不同,部分采用命令方式驱动,部分采用菜单驱动方式。,2、字符串检索(也叫短语检索或词组检索phrase)它是将一个字符串(通常用双引号“”括起来)当作一个独立的运算单元进行检索。实际上体现了邻近位置运算(Near运算)的功能。,3、截词检索 在一般的数据库检索中,截词法常有左截、右截、中间截断和中间屏蔽等几种形式;而在搜索引擎中,目前只提供右截法,其截词符通常采用星号(*),如educat*相当于 education+educational+educator。,4、字段检索和限制检索 字段检索是限制检索的一种。限制检索往往是对字段的限制。5、位置检索 如临近位置运算(near运算)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 利用 教案
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5399704.html