网络信息资源的检索.ppt
《网络信息资源的检索.ppt》由会员分享,可在线阅读,更多相关《网络信息资源的检索.ppt(73页珍藏版)》请在三一办公上搜索。
1、网络信息资源及其利用,“闲话”开篇,请先考虑以下问题:你为什么上网(或上网干什么)?你认为网络上有什么?你希望通过这次课学到什么?,小结:通过这门课程的名称变化的讲解,我们应该了解:,我们所处的信息环境是在不断变化的信息技术条件对信息环境的变化是革命性的。信息环境影响、催化或在一定程度上决定了人们的信息需求。教材永远跟不上信息环境和人们信息需求的变化。,网络社会,在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是终身学习的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其对人的影响更为深远。所以本节不
2、仅仅介绍网络信息资源及其利,还对网络学习与网络交流方面的内容做了介绍。,网络信息资源及其利用【目录】,0 网络基础1 网络信息资源概念、类型及其特点2 网络信息资源的评价与选择3 网络信息检索工具4 开放获取信息资源及其利用5 e_print信息资源及其利用6 博客与RSS信息资源利用7 FTP资源及其利用8 Maze、BT、eMule资源及其利用9 网络交流与学习:电子邮件BBS新闻组的使用10 咨询服务系统和答案搜索引擎11 百科全书、字(词)典、辞典黄页白页12*学术与教学信息资源及其利用13 因特网上的免费信息资源(P6170),0 网络基础,0.1 认识IP地址0.2 认识网络地址和
3、域名0.3 域名与网络信息资源有什么关系?,0.1 认识IP地址,人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址。如在图书馆无线上网就是动态IP地址,每次所取得的地址不同。,0.2 网络地址和认识域名,虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。域名也由若干部分组成,
4、各部分之间用小数点分开,例如我校主机的域名是:“”。域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“”。通常,进行网络访问时,域名的www可以省略。如,可以直接输入。不能省略的与域名服务器的配置有关。域名一般不会变动。,网络地址-网址-URL,网络地址是URL(UniformResourceLocator)的俗称,一般由三个部分构成,各个部分如下:1.服务器标识符通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTTP:/、FTP:/、GOPHER:/、TELNET:/、NWES:/等等类型,分别指定为采用超文本传输
5、协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。2.信息资源地址信息资源地址是由两部分构成的,一是机器名称,如是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。3.路径名路径名是给出资源在所在机器上的完整文件名.如:例一:代表存放主机上的pub/files/目录下的一个文件,文件名是foobar.txt。,0.3 域名与网络信息资源有什么关系?,由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它
6、们分别以不同的后缀结尾:随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。ac 代表科研机构由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:中国的商业.org.hk 香港的组织.net.jp 日本的网络,对网络信息资源的获取与评价有参考作用,.com 商业公司.org 组织、协会等.net 网络服务,.edu 教育机构.gov.政府部门.mil 军事领域,全世界为美国打工,目前,全世界共有13台根服务器,其中10台在
7、美国,而且2台由美军使用,1台由美国国家航空航天局使用。也就是说,每天世界各地的电子邮件有很多要先由美国人“过目”之后才能去它该去的地方。此外,美国私营公司掌握着全世界互联网域名的分配大权。假如美国与日本的关系急剧恶化,只要美国通过技术手段删去日本的域名“.jp”,日本马上就会成为“网上孤岛”,无法通过网络与外界联系。全世界的网络用户都要向美国支付费用,“全世界都在为美国打工”。近几年国家开始重视信息安全,一位在信息安全领域沉浸了20多年的专家称:“作为全球第二大经济体,中国几乎是赤身裸体地站在已经武装到牙齿的美国八大金刚面前。2002年,美国与伊拉克交恶,伊拉克顶级域名“.iq”一度被封杀,
8、伊拉克因此一度在虚拟世界中“蒸发”,直到2005年,互联网域名与地址管理机构ICANN才将“.iq”重新交回伊拉克人民手中。,更多,www指的是什么?即是万维网(WWW-World Wide Web):是基于超文件的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。浏览web信息的网络浏览器有哪些?微软IE(Internet Explorer)网景(Netscape)遨游(maxthon)腾讯TT浏览器MYIE,1 网络信息资源概念、类型、特点,1.1 概念:网络信息资
9、源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。,1.2 网络信息资源的类型,按信息内容的表现形式和内容划分可分为全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等;数值型信息:主要是指各种统计数据;数据库类信息:如DIALOG,万方等,是传统数据库的网络化;微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。其它类型:投资行情和分析,图形图象,影视广告
10、等。,按所采用的网络传输协议可分为:,WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用于连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流
11、的信息资源是网络上最自由、最具有开放性的资源。news,1.3 网络信息资源的特点,复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体
12、,质量良莠不齐。增加了信息识别和利用的难度。,续,正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。网络营造了“地球村”,既 极大地促进了人类信息资源的共享,又带来了一些意想不到的问题,如文化冲突、信息侵略、信息威慑等。使用成本低 共享程度高 是信息资源的宝库,2.2 网络信息资源的评价与选择,相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。网络信息资源的评价与选择主要是针对信息源。内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息
13、资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。定量的评价:Google的pagerank,星数评价等级。,权威性,在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需3/10以上。主要关注如下问题:所采集的网站(页)的主办者是否为有声誉的大学、学会/协会、实验室?网站是否通过权威评价机构评价过?所选的站点是否被多个internet站点链接?
14、网站是由某公司、机构还是某领域的著名的权威或专家赞助?信息提供者的教育背景和职业背景及其研究方向?责任者有知名的出版物吗?信息是否经过过滤?信息是否经同行评议过?资源是否由相关的权威推荐?是否有与权威机构的页面的共同链接?出版社是否知名和有声望?出版社是否是公认的出版界的权威?出版社是否是大学的出版社?是否有任何原创作品?选择的资源与其它作品有相关性吗?,准确性,信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。主要考虑所选网站(页)提供的信息是否准确?是否提供了信息的来源和出处以备用户进一步核查;网页引证的书目或提供的参考能
15、否证实信息的准确性?页面的句法和拼写是否准确?有否排印错误?提供的信息是否完整规范?,稳定性,信息资源需有较长的稳定期或有稳定运行的保障机制。主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?,可获得性,信息资源揭示信息的层次中,至少一个能无障碍地获得。主要要考虑的是题名信息还是文摘信息或全文信息?是否有对信息结论的阐述标准?是否给出了表明信息内容的关键词或主题词?希望在该网页上找到何种信息?主题的涵盖面是否全?索引或目次页是否隐含了综合性的内容?是否免费?是否注册?是否国际流量?是否符合标准?是否有其它格式或镜像?某种类型的信息有使用
16、期限制吗?访问资源的方式是否依赖用户使用的设备?是否需要专门软件(如浏览器)?是否有方便的导航?是否容易链接所需的信息?是否有清晰的链接标签?是否能分别打印页面和文献的某一部分?是否能发送到电子邮箱?是否提供多种检索方式?检索信息的效率如何?,3 网络信息检索工具,当已经知道地址时直接通过地址访问。当不知道地址的时候,需要借助检索工具3.1搜索引擎3.2网络资源指南(门户)3.3专门数据库,3.1 搜索引擎P41,搜索引擎分类分类目录型分类目录虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。完全可以不用进行关键词(Keywords)查询,仅靠分类目录也
17、可找到需要的信息。如Yahoo雅虎、新浪。其他著名的还有Open Directory Project(DMOZ)、Look Smart、About等。现在许多搜索引擎在提供搜索服务的时候也同时提供这一类服务。,分类目录型搜索引擎提供了一份按类别编排因特网站点的目录,各类下边,排列属于这一类别网站的站名和网址链接。适用情况:适合于用户对要检索的东西没有明确的主题概念,只知道大致的类属 特点:描述准确,用户可以很方便的查找到所需信息。没有统一的分类体系,类目之间容易交叉。,DMOZ开放式分类目录,DMOZ网站是一个著名的开放式分类目录(Open Directory Project),之所以称为开放
18、式分类目录,是因为DMOZ不同于一般分类目录网站利用内部工作人员进行编辑的模式,而是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。,全文搜索引擎,全文检索型搜索引擎处理的对象是因特网上网站中的每个网页,用户得到的检索结果,通常是一个个网页的地址和相关文字。这类搜索引擎的特点是信息量大,索引数据库规模大,更新较快。但是它也有不足之处就是检索结果反馈的信息往往太多,太滥,以致用户很难直接从中筛选出自己真正感兴趣的东西,要想达到理想的检索效果,就要借助于必要的语法规则和限制内容。,搜索引擎工作原理,工作原理 一个完整的搜索引擎由以下三个部分组成:图示:(1)人工或自动巡视软件(如网络蜘蛛
19、Web Spider,爬行者Crawler,网络机器人 Robots等);(2)索引库或分类目录;蜘蛛程序发回的网页,保存在数据库中,并对其进行标引(提取网页标题,关键词,日期等),对标引词建立索引。(3)用于检索索引库的检索软件及浏览Web界面等部分组成。,更多,中文搜索引擎指南网搜网:搜索引擎观察专业、元、多媒体、购物http:/著名搜索引擎简介:,搜索引擎:水平门户_综合搜索引擎中文,中文常用搜索引擎百度中文搜索引擎:Google中文搜索引擎:搜狐搜狗搜索:雅虎:新浪:网易:TOM搜索:北大天网搜索引擎:奇虎,搜索引擎:水平门户_综合搜索引擎英文,国外英文常用搜索引擎Google 以搜索
20、精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。Fast/AllTheWeb 总部位于挪威的搜索引擎后起之秀,风头直逼google。AltaVista 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。Overture 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。Lycos 发源于西班牙的搜索引擎,网络遍布世界各地。HotBot 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。,搜索引擎:垂直搜索引擎,垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。垂直搜索引擎不但可保证此
21、领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但 检出结果重复率低、相关性强、查准率高,适合于满足较具体的、针对性强的检索要求。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。,垂直搜索引擎举例:1,找工作的搜索引擎:google学术搜索:google图书搜索:比价购物搜索引擎:人脉搜索引擎:若邻网交友,找工作,商机 人物、软件 论坛搜索引擎:,垂直搜索引擎举例:2,The Music Finder Singingfish(只能搜寻声音和录像)旅行TripAdvisor 计算机科学研究和文章 图像搜索引擎:图像词
22、典商业搜索引擎Business 生意定向搜索引擎。DailyStocks cc 可以了解被查询公司存货的信息已经相关的新闻报导,研究,引述和其他数据。FMLX 英国定向的关于公司,存货数据,分析和研究的搜索引擎。eBizSearch 关于电子商务的文章和报告。,综合搜索引擎的专门化趋势:,搜狗(Sogou)人物、音乐、购物、图片、地图 GOOGLE 学术搜索:GOOGLE 图书搜索 AllTheWeb 能专门对图像、多媒体信息。,参见“搜索引擎观察”之专门搜索引擎Answers Searching|Computer Search Engines Domain Searching|Financi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息资源 检索

链接地址:https://www.31ppt.com/p-6016755.html