《信息化能力建设.docx》由会员分享,可在线阅读,更多相关《信息化能力建设.docx(54页珍藏版)》请在三一办公上搜索。
1、信息化能力建设主讲人:查先进打印讲义 【主讲人简介】 博士,武汉大学教授、博士生导师,“教育部新世纪优秀人才支持计划” 获得者,兼任中国科学技术情报学会理事、湖北省信息学会理事。主要从事信息分析、竞争情报、信息资源配置与管理领域的科研和教学工作。 提纲 绪论 信息系统开发与管理 信息组织与检索 信息分析与服务 信息技术应用与信息产业发展 领域信息化 信息化能力评价 信息资源开发与利用 一、 绪论 社会信息化 信息化能力及其表现 信息化能力和竞争力 1.1 社会信息化 信息资源与物质资源和能源资源,已经成为现代社会经济发展的三大支柱。 社会信息化的典型表现人类社会对信息资源的依赖程度越来越高,而
2、对物质资源和能源资源的依赖程度则相对降低。 信息要素广泛渗透到人类社会各种经济活动中,社会经济的发展主要不是依赖物质材料的增加和新能源的开发,而是依赖信息力量的推动。 2006年-2020年国家信息化发展战略提出我国信息化发展的战略目标:综合信息基础设施基本普及,信息技术自主创新能力显著增强,信息产业结构全面优化,国家信息安全保障水平大幅提高,国民经济和社会信息化取得明显成效,新型工业化发展模式初步确立,国家信息化发展的制度环境和政策体系基本完善,国民信息技术应用能力显著提高,为迈向信息社会奠定坚实基础。 1.2 信息化能力及其表现 国家信息化在国家统一规划和组织下,在农业、工业、科学技术、国
3、防及社会生活各个方面应用现代信息技术,深入开发、广泛利用信息资源,加速实现现代化的过程。 国家信息化能力在国家统一规划和组织下,在农业、工业、科学技术、国防及社会生活各个方面应用现代信息技术,深入开发、广泛利用信息资源,加速国家实现现代化的进程快慢的差异程度。 企业信息化企业以业务流程(优化)重组为基础,在一定的深度和广度上利用计算机技术、网络技术和数据库技术,控制和集成化管理企业生产经营活动中的所有信息,实现企业内外部信息的共享和有效利用,以提高企业的经济效益和市场竞争能力。 企业信息化能力企业在实施信息化的过程中,由于基础条件、经济、管理等方面的因素所导致的信息化进程快慢的差异程度。 信息
4、化能力的表现形式 信息系统开发与管理能力 信息系统开发一般分为系统分析、系统设计、系统实施三个阶段。为了确保信息系统的正常运行与信息畅通,实现信息资源共享和高效率利用,信息系统进入使用阶段后的任务是对信息系统进行运行管理和维护。 信息组织与检索能力 信息组织是将处于无序状态的特定信息,根据一定的原理和方法,使其成为有序状态的过程。信息检索是一种有目的和组织化的信息存取活动,是对信息集合与需求集合的匹配与选择。 信息分析与服务能力信息分析是在大量搜集原生信息的基础上,通过去粗存精、去伪存真、由此及彼、由表及里的分析处理和评价,形成对经济决策或其他社会活动有参考利用价值的信息成果。其本质在于不断提
5、高信息服务的质量和水平,满足用户的实际信息需求。 信息技术应用与信息产业发展能力信息技术已逐渐成为衡量国家综合国力、社会信息化水平的关键因素。信息技术能够改造传统产业,带动国民经济迅速增长,实现社会的可持续发展。信息产业是工业社会发展到一定阶段后的产物,代表了继农业、工业、服务业之后社会发展的方向。 领域信息化能力领域信息化是要以数字化、网络化、个性化的方式,推进信息技术在社会各个领域的深入应用,如电子商务、电子政务、教育信息化等。 信息资源开发与利用能力当前,信息意识空前高涨,但信息资源配置中的低效率甚至无效率情况依然普遍存在,不公平现象时有发生。这在一定程度上构成了信息资源共享的障碍。因此
6、,加强信息资源的开发利用意义重大。 信息化能力的表现是多层面的,还可以从信息素养、信息意识、信息文化、信息技术自主创新能力等方面加以考察。 信息素养即对信息的获取、加工整理、分析、评价、管理、表达与交流的能力。它既涉及信息内容本身,也涉及信息活动的过程、方法和结果。一个有信息素养的人,应当具备如下能力:知道何时需要信息;知道解决特定的问题需要什么样的信息;知道如何获取所需要的信息;知道如何组织、分析处理、管理和评价信息;掌握运用信息有效地解决问题的技能。 信息意识即人脑对信息在社会发展中的性质、地位、作用、价值等的认识和反应。它决定了人们捕捉、判断和利用信息的自觉程度。一个具有强烈信息意识的人
7、,通常对信息具有敏锐的感受力和持久的注意力,对信息价值具有良好的判断力和洞察力。 信息文化是人类社会发展过程中的一种文化形态,人类思维方式和观念的变革、社会文化的结构性变革主要是由信息技术和网络技术的应用而形成的全新的社会基础结构所导致。典型表现:信息和信息技术大量介入人类的生产、生活、娱乐、管理与决策等领域,强烈地影响着人们的世界观,促进人类文明的巨大进步。 信息技术自主创新能力IT创新有多种实现途径。在新IT的形成和扩散中,一般可分为技术领先者、技术追随者和技术后来者。技术领先者和追随者通常可以尝到先行者的甜头,从中获取巨大的利益。技术后来者不能获取因先行而产生的利益,但仍可从“后发优势”
8、中获利。 1.3 信息化能力和竞争力 优胜劣汰,适者生存竞争是当今世界普遍存在的社会现象,政治、军事、经济、科技、文化等社会生产、生活乃至娱乐的各个领域。 市场经济条件下各个企业之间的竞争,即在市场经济条件下,企业作为商品生产者和经营者为了争取实现企业自身的经济利益,并获得有利的产销条件而发生争夺、较量、对抗的经济关系。 企业竞争力生产者以比竞争对手更具吸引力的价格和其他参数生产和销售自己的产品和劳务的能力,或者企业争取用户和争夺市场的能力,决定了企业之间竞争的基本格局和最终结果。企业竞争力一般是由品种、质量、价格、信誉和服务五个要素构成。 企业核心竞争力企业在市场竞争中所拥有的独特的获取利润
9、、谋求生存、持续发展的能力。表现在:一是对最终产品中的顾客利益有突出贡献,创造顾客价值;二是竞争对手难以模仿,具有独特性。 核心竞争力理论认为,企业是一个能力系统或能力的特殊集合,企业竞争优势的差异是由于企业能力不同造成的。企业各种能力中的核心部分,可以通过整合和外向辐射等,作用于企业的其他各种能力,影响着其他能力的发挥和整体能力效果。 对企业市场竞争能力的判别20世纪60年代看成本70年代讲质量80年代强调速度90年代突出服务21世纪创新(知识&信息资源) 信息化能力对竞争力的影响 社会信息化的出现给人类带来了新的资源、新的财富和新的社会生产力,也带来了国际社会新的竞争方式、竞争手段和竞争内
10、容。 信息经济区于传统经济形态的根本特征: 信息成为主导资源。 信息成份大于物质成份的产品和服务占主导地位。 信息市场成为市场体系的重要组成部分。 信息产业成为国民经济中的主导产业。 企业竞争优势有多种表现,如人才优势、资金优势、技术和设备优势、经营方式优势、原材料优势、信息优势等,但在信息时代里归根结底表现为通过推进信息化建设所营造的信息优势。也就是说,谁取得了信息优势,谁就获得了在市场上生杀予夺的主动权。 例如: 关于企业内部和外部的一切与提高企业竞争力有关的信息主要涉及竞争对手、竞争环境、竞争战略等方面。显然,这些信息是为竞争目的而专门采集来的,并且经过深加工发生了增值。充分分析和利用这
11、些信息是企业信息化能力的一个重要体现,有助于企业在信息化社会赢得和保持竞争优势,提升竞争力。 以IBM公司为例,IBM公司曾经列出12个竞争对手,对其加以跟踪和研究,并且取得了巨大的成功。20世纪80年代末期,由于IBM公司对市场竞争趋势的判断出现重大失误,忽视了当时迅速发展的个人计算机革命,仍然认为大型主机硬件设备的研制开发会给公司带来持续的繁荣。到20世纪90年代,公司终于陷于严重的困境中,在1991年至1993年,IBM公司的亏损超过147亿美元,成为美国公司历史上最大的净亏损户。1993年1月,IBM公司新的董事长兼首席执行官盖斯特接任,他提出要“立即加强对竞争对手的研究”。通过努力,
12、IBM公司增强了适应市场变化和对抗竞争的能力,最大限度地满足了全球市场上客户们的需求,公司销售收入持续增长。二、信息系统开发与管理 信息系统的结构和功能 信息系统分析、设计和实施 信息系统的运行管理和维护2.1信息系统的结构和功能 信息系统及其类型 信息系统主要是指由计算机硬件和软件、网络和通信设备、信息资源、信息用户等组成的人机系统。它不仅能管理信息,而且能搜集、存储、处理、检索和传输信息,必要时还能向有关人员(特别是决策者)提供有用信息。 信息系统的“金字塔”型四层结构模型 战略计划层信息主要是通过定量分析和预测得到的用于管理与决策活动的综合性信息,而不是具体、详细的信息。战略计划层的信息
13、系统在管理方法上通常是建立以数据库、模型库为基础的计算机决策支持系统。 管理控制层,根据战略计划层的要求,及时给出所需要的带有统计或预测性质的各种管理信息。这一层要求能为各级管理人员的管理活动提供用于制定、组织、控制等活动所需要的信息。 操作控制层信息用来显示天天要重复的操作过程,通常利用事务数据处理模块、报表生成模块和查询模块来产生事务活动的单据、统计报表和查询应答。 事务数据处理层,信息系统的前述三个层次主要是辅助不同层次的管理活动,第四个层次即事务数据处理层则侧重于为其余所有内部信息辅助活动提供基础。 信息系统无处不在 信息系统的结构 - 信息系统内部各组成要素之间相对稳定的分布状态、排
14、列顺序和作用方式。它既可以是逻辑结构,也可以是物理结构。 信息源 - 各类原始数据的来源。信息系统以这些原始数据为搜集和处理对象。 信息处理器 - 承担信息的加工、存贮、检索、传输等任务。 信息用户 - 信息系统服务的对象,经过加工处理后的信息提供给信息用户后,往往可以有效地帮助其进行决策和选择。 信息管理者 - 负责信息系统的设计实现,以及系统实现后的系统运行、协调和维护工作。 信息系统虽在特定的组织内,但它是一个开放系统,与外界有物质、能量、资金和信息的交换。信息系统是一个多层次、多变量、多因素、多功能的复杂系统,受多种因素的制约,其发展与现代信息处理技术的进步密切相关。 信息系统的物理结
15、构由基础部分和功能部分组成。其中,基础部分包括组织制度、信息存贮、硬件系统和软件系统。 功能部分是针对组织的各项业务而建立的信息处理系统,对企业而言,可能包括质量管理、产品销售、经营管理、生产管理、财务会计等方面。2.2信息系统分析、设计和实施 系统分析:进行需求调查,提出新系统的逻辑方案。 系统设计:根据系统逻辑方案完成系统软、硬件的设计。 实施阶段:将设计阶段的成果转化为实际运行的系统。 (一)系统分析 1需求调查包括初步调查和详细调查。 初步调查的目的是从整体上了解企业信息系统建设的现状,结合用户提出的系统建设要求进行可行性分析,论证建立新系统的必要性和可能性,主要考虑经济上、技术上以及
16、运营管理上的可行性。 详细调查的目的是在初步调查的基础上,完整地掌握现行系统的现状,发现问题和薄弱环节,广泛地搜集资料,为系统需求分析、组织结构和功能分析、业务流程分析、数据流程分析等各种分析活动提供资料。 2业务流程分析 业务流程分析能够帮助我们了解一个业务的具体处理过程,发现和处理系统调查工作中的错误和疏漏,修改和删除原系统的不合理部分,在新系统基础上优化业务处理流程。一般采用业务流程图进行业务流程分析。 3数据分析 数据分析的主要工具是数据流程图和数据字典。 (1)数据流程图 数据流程图(DFD)是一种全面描述数据在系统中流动、存储和处理的逻辑关系的图形工具,是信息系统逻辑模型的重要组成
17、部分。 利用DFD进行数据流程分析只关注数据在系统中的流动过程,包含数据输入、传递、处理、存储、输出等,以此来考察和分析数据处理模式,发现和解决数据流程中的问题,并不涉及任何具体的组织机构和处理工作。 (2)数据字典 DFD只能描述系统逻辑功能的总体框架,数据流程中有关数据的其他详细信息需要利用数据字典进行定义。数据字典就是对数据流图上所有成分的定义和解释。主要条目包括:数据流、数据元素、数据结构、数据存储、数据处理、外部实体。 编写数据字典时,对数据流图上各种成分的定义必须明确、易理解且唯一;命名、编号要与数据流图一致,必要时可增加编码。 4描述处理逻辑 数据字典可以定义DFD上简单的处理逻
18、辑,复杂的处理还有必要进一步说明,描述复杂处理逻辑的工具主要有:结构化语言、决策树、决策表。 结构化语言:由“IF”、“THEN”、“ELSE”组成的规范化语言。 决策树: 一种图形工具,左边结点为决策结点,与决策结点相连的成为方案枝,最右方的方案枝的端点表示决策结果。 决策表: 当判断条件多且相互组合,相应的决策方案较多时,采用决策表(表格)的形式,为描述这种复杂逻辑提供了表达清晰、简洁的手段。 5系统分析报告 第一部分:开发项目概述。 第二部分:现行系统概况;新系统开发的可行性;系统需求说明;新系统的逻辑方案,包括组织结构图、业务流程图、数据流图、数据字典、数据存储分析、查询分析、数据处理
19、分析等。 第三部分:项目实施计划,包括工作分解、进度和预算。 (二)系统设计 任务:在系统分析的基础上,按照逻辑模型的要求,科学合理地进行系统的总体和详细设计,实现物理模型,为系统实施提供依据。 1系统总体设计 (1)系统总体布局方案的确定。包括系统的硬、软件资源以及数据资源在空间上的分布特征。主要有集中式系统和分布式系统。 (2)软件系统总体结构的设计。根据系统总体目标和功能将整个系统合理地划分成几个大的功能模块,每个大模块又分解成几个更小的模块,并正确地处理模块与模块之间的调用关系和数据联系、模块内部的联系,以及定义各模块的内部结构。 (3)数据存储的总体结构设计。确定数据的总体结构,各类
20、数据记录和数据项的逻辑描述、数据文件的组织方式、各类数据文件之间的逻辑关系;确定存储设备和存储格式;确定数据存储的空间分布;选择数据库管理系统。 (4)计算机和网络系统方案的选择。配置系统软、硬件环境,确定网络系统结构。 2系统详细设计 (1)代码设计:代码是用来表征客观事物的实体类别以及属性的一个或一组易于计算机识别的特定符号或记号。代码设计的原则:唯一性、标准化与通用性、合理性、稳定性、可扩充性与灵活性、具有规律性、简洁性。 (2)数据库设计:包括三个阶段。概念结构设计是根据用户需求设计数据库的概念模型,一般用实体联系模型(E-R图)表示。逻辑结构设计是将概念结构设计阶段完成的概念模型转换
21、成选定的数据库管理系统(DBMS)支持的数据模型。物理结构设计是为数据模型在设备上选定合适的存储结构和存取方法,以获得数据库的最佳存取效率。 (3)输入输出设计:输入设计的内容包括确定输入内容、输入格式;用户界面设计;输入数据的正确性检验;输入方式设计;确定输入设备。输出设计的内容包括确定输出内容、输出信息使用情况、输出方式设计、选择输出设备与介质、输出格式设计等。 (4)处理过程设计:用一种合适的表达方式来描述每个模块内部的执行过程。常用方法有程序框图(流程图)、各种程序设计语言等。 3系统设计报告是系统设计阶段的主要成果,是面向系统管理人员的技术手册,也是系统实施的重要依据。其着重点在于阐
22、述系统设计的指导思想以及所采用的技术路线、方法和具体的技术措施。 (三)系统实施 1系统实施的任务 把信息系统分析设计的结果付诸于实际,实现具体软件系统的阶段。主要任务包括硬件准备、软件准备、人员培训、数据准备、系统测试、系统切换与试运行等几个方面。 2系统测试 目的是为了尽可能多地发现系统中存在的尚未发现的错误,一个成功的测试就在于它发现了迄今为止尚未被发现过的错误。设计测试用例时要以发现和暴露程序错误为目标,尽可能多地使用一些容易暴露问题的测试数据。 3系统切换 系统切换就是用新系统代替旧系统的过程。 (1)系统切换前的准备工作 包括数据准备、文档准备、用户培训。 (2)系统切换的三种方式
23、 包括直接切换、并行切换、逐步切换。 2.3信息系统的运行管理和维护 信息系统的运行管理 1.系统运行管理的内容 主要任务是对信息系统的运行过程进行控制、记录其运行状态,并在必要的时候对系统进行修改和补充,以使之真正符合管理决策的需要,为管理决策者服务。信息系统运行管理主要通过行政手段,并辅以技术手段进行。通过实施信息系统的运行管理,有助于保持信息系统的稳定性、先进性、实用性、高效性,避免系统混乱现象的发生。信息系统投入使用后的运行管理工作包括:数据的搜集、校验和录入;数据处理;系统硬件的运行和维护;信息系统的安全管理。 2.系统运行情况记录 有助于不断探索和总结经验,提高信息系统的质量。如果
24、缺乏系统运行情况的详细记录,则无法对系统运行情况进行科学的分析和合理的判断,无法进一步优化信息系统的性能。包括工作数量、工作效率、信息服务质量、维护修改情况、系统的故障情况等。为使系统运行情况记录记载得完整准确,要坚持在事情发生的当时当地,由当事人记录。此外,还要尽量采用固定的表格或本册进行记录,记录时用词确切,尽可能给予定量描述。 信息系统的维护 1. 系统维护的内容 信息系统投入运行后,需要不断地对系统进行各项修改和维护,以改正潜在的错误,扩充和完善功能,延长系统寿命。信息系统维护一般包括: (1)软件维护(正确性、适应性、完善性、预防性) (2)数据维护 (3)代码维护 (4)硬件维护
25、2. 系统的可维护性 系统维护工作直接受到系统可维护性的影响。可维护性是对系统进行维护的难易程度的度量,影响系统可维护性的主要因素有: (1)可理解性:理解系统结构、接口、功能和内部过程的难易程度 (2)可测试性:对系统进行测试和诊断的难易程度 (3)可修改性:对系统各部分进行修改的难易程度 (4)可扩充性:对系统进行扩充的难易程度 系统的可维护性很难量化的,但可以通过能够量化的维护活动的特征来间接地定量估算系统的可维护性。例如把维护过程中各项活动所消耗的时间记录下来,用以间接衡量系统的可维护性,其内容包括:识别问题的时间、管理延迟的时间、维护工具的搜集时间、分析和诊断问题的时间、修改设计说明
26、书的时间、修改程序源代码的时间、局部测试的时间、系统测试和回归测试的时间、复查的时间以及恢复的时间。三、信息组织与检索 概述 信息组织 信息检索 3.1概述 信息存储与检索将信息按照一定的方式组织和存储起来,并能根据信息用户的需求找出其中相关信息的过程。它是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。 例:Web网站的设计和使用 Web网站的设计,首先涉及到各类材料的组织问题,它们包括内容设计、导航设计和表现设计。 内容设计要确定分类的准则,然后根据分类准则,划分信息内容。例如大学网站按学校概况、管理机构、院系设置、招生信息、信息资源、图书馆、科学研究、教师队伍、学
27、生活动等主题分类。 导航设计涉及到信息单元的浏览、用户与Web内容及结构的交互。Web的两个基本元素是网和链,链把页面关联起来,构成巨大的“蜘蛛网”Web。 表现设计,例如颜色、表现结构布局、表现顺序、表现方式等,目的是提供一个易于获取信息的Web环境。 设计的Web网站仅仅提供分类目录和链的浏览是不够的,尤其是对大中型的Web网站来说,用户在浏览过程中容易迷航或在信息查找中花费太多的时间,而又难以得到相关的信息内容。 搜索引擎提供对Web网站信息内容的组织和检索。检索系统能够为任何水平的用户,包括专业用户和一般用户提供有效的信息检索服务。 对于网页文档中的图像、视频和音频,可以结合基于内容的
28、多媒体信息检索技术。3.2信息组织 1信息组织的基本原理 信息组织是将处于无序状态的特定信息,根据一定的原理和方法,使其成为有序状态的过程。其目的是将无序信息变为有序信息,方便人们利用信息和有效地传递信息。 信息组织的依据是事物的属性,这些属性可归纳为形式、内容和效用三种类型。以服装为例,款式、大小、生产厂家、生产时间和地点等属于形式特征,服装原料的物理和化学结构属于内容特征,御寒、防雨、防晒等属于效用特征。 信息组织的过程可分为序化和优化两个阶段。 信息的序化是按照一定的方法将无序的信息组织成有序的信息的过程,它包含两层含义:一是为了利用和管理上的方便,对没有必然内在联系的信息加以组织;二是
29、对本质上有必然内在联系的信息,按照其自身的客观逻辑结构加以组织。前者融入了更多的主观因素,后者则依据更多的客观因素。 信息的优化是在信息序化的基础上进行的,是针对某种目的对信息进行再序化的过程。在信息组织的实际操作过程中,信息的序化和优化之间并没有十分明确的界限。 信息组织的目的1)减少社会信息流的混乱程度。2)提高信息产品的质量和价值。3)建立信息产品与用户的联系。4)节省社会信息活动的总成本。 信息组织的方法 (1)语法信息组织方法 以信息的形式特征为依据序化信息的方法。它不涉及信息的含义和用途,需要遵循方便性、标准化等原则。 1)字顺组织法 从字、词的角度集约有关信息,又有音序法、形序法
30、、音序和形序并用三种形式,如书名的排序、著者姓名的排序和主题词的排序等。 2)代码组织法 以代码表征信息和集约信息的方法,优点是简便易用,尤其适合计算机管理,如专利代码组织法、商务条码组织法、身份证代码组织法、军队番号组织法和电话号码组织法等。 3)地序组织法 以信息的空间特征为依据序化信息的方法,特点是能反应地域特色。如各种地图、地理文献和风景名胜介绍等的组织。 4)时序组织法 以信息的时间特征为依据组织信息的方法,优点是能反映事物的发展规律,多为线性结构,如史书、年表、日记、传记、档案和连续出版物等的组织。 5)其他组织法 包括颜色组织法(如绿色代表邮政)、形状组织法(如以书刊的开本大小为
31、依据的组织法)、重量组织法(如拳击手的分类)等。 (2)语义信息组织方法 以信息的内容或本质特征为依据序化信息的方法。需遵循客观性原则。 1)逻辑组织法 根据信息之间的逻辑关联组织信息,如政策的制定、研究报告的撰写、文学作品中人物性格的发展等。 2)分类组织法 包括科学分类、文献分类、专利分类、商品分类、职能分类等,能反映事物之间内在的、本质的联系和区别,便于人们系统地认识和了解信息。 3)主题组织法 从事物内含的主题属性出发,以词语作为概念标识,并通过概念标识的字顺排列和参照方法等间接地揭示概念之间相互关系的一种信息组织法,包括标题法、单元词法、叙词法、关键词法等几种类型。 (3)语用信息组
32、织方法 以信息的效用特征为依据序化信息,能反映和满足用户的信息需求。需遵循目的性、适用性和个性化原则。 1)权值组织法 赋予不同信息以不同的权重值,以权值大小组织信息。如决策方案的选择、教学质量的评估等。 2)概率组织法 根据事件发生的概率大小序化信息。如预测体育比赛的胜负、期货交易等都。 3)特色组织法 根据用户某一方面的特殊需求组织信息,如根据用户的兴趣组织球迷信息、摄影信息、旅游信息等。 4)重要性递减组织法 依据信息的重要程度序化信息,通常的做法是突出重要信息使其处于醒目位置,而将其他信息置于相应位置,如大众传播的栏目设置。 网络信息组织 传统的信息组织多采用手工编制的目录、索引、文摘
33、、综述等形式,局限于文献信息的组织。在网络环境下,数字化信息占主导地位,信息组织的对象逐渐多样化,范围也随之扩大,不再停留于对文献特征的描述,而深入到知识和信息单元,致使传统的信息组织方式不能满足人们的各种信息需要。 网络信息组织就是根据网络信息特点和属性,采用科学的方法,将大量的、分散的、杂乱的信息经过搜集、筛选、整序、优化,形成一个便于有效利用的整体的过程。 (1)一次网络信息组织方式 1)文件方式 文件是存储非结构化信息的天然单位。但在网络环境下,由于文件本身需要作为对象来管理,对结构化信息组织显得软弱无力,文件方式只能是一次网络信息组织的辅助形式。 2)超媒体方式 将文字、表格、声音、
34、图形、图像、视频等多媒体信息以超文本方式组织起来,人们通过浏览的方式搜寻所需信息,避免了检索语言的复杂性。 3)网站方式 通过标记语言,将信息组织成一个个页面,页面对某机构、个人或专题作全面介绍,用主页将这些信息集中组织到一起,通过浏览器浏览。 (2)二次网络信息组织 1)主题树方法 将所含某一学科的所有已获得的信息按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索(即相关站点链接),并通过信息线索直接找到相应的网络信息资源。 2)数据库方法 将所有已获得的信息以固定的记录格式存储,用户通过关键词及其组配查询,找到所需要的
35、信息线索(即相关站点链接),并通过信息线索直接找到相应的网络信息资源。3.3信息检索 信息检索的类型 早期分类方法 (1)文献检索。通过二次文献找出所需的一次文献或三次文献。 (2)数据检索。以数据为对象的检索,如查找某一数据。 (3)事实检索。以特定的事实为检索对象。事实内容包括大量的科学事件和社会事件。 (4)概念检索。查找特定概念的含义、作用、原理或使用范围等解释性的内容或说明。 新分类方法 (1)文本检索。以各种自然语言符号系统所表示的信息为主要检索对象。是传统的文献检索方式的延续。 (2)数值检索。针对数值型数据的查询而发展起来的。它不仅能检索出符合特定需求的数据信息,而且还可以在此
36、基础上提供一定的数据运算能力和推导能力。在财经、金融、统计等领域应用广泛。 (3)音/视频检索。针对各种数字化音频和视频信息而进行查询。目前正在研究和探索之中,属于前沿领域。 信息检索的原理 信息检索对信息集合与需求集合的匹配与选择 要对信息集合进行特征化表示,即通过人工或计算机的方法对信息集合进行加工处理,将原来隐含的、不易识别的特征显性化。这种加工处理工作被称为内容分析与标引。 要对用户所提出的信息需求进行分析,提取概念或属性,并利用与标引过程相同的标识系统(检索语言)来表达需求中所包含的概念和属性。 过匹配和选择机制,对需求集合与信息集合进行相似性比较。根据一定的标准选出符合需要的信息。
37、 网络信息检索通过网络信息检索工具检索存在于因特网信息空间中各种类型的网络信息资源。 1搜索引擎 根据一定的策略、运用特定的计算机程序搜集Web上的信息,并在对这些信息进行组织和处理后为用户提供检索服务的系统。 搜索引擎为用户提供了一个友好的检索入口,用户只需提供检索式(关键词列表)便能搜寻到包含这些关键词的相关网页。 搜索引擎通常包括 Crawler(爬虫)模块、索引模块、数据集分析模块、检索引擎模块、排序模块和用户模块,以及索引数据集和/或网页数据集。 搜索引擎依赖于Crawlers进行网页爬行,一个Crawler就是一个能自动爬行Web网页以供生成本地索引和/或本地网页数据集的程序。 索
38、引模块对缓存中的每一个网页进行全文扫描,抽取所有的词条,并记录URL信息,形成一个巨大的能提供检索所有词条所在页面的索引库,并将数据存储在索引数据集中。除了传统的文本索引外,索引模块在数据集分析模块帮助下,还能产生反映网页间链接的结构索引和其他的功能索引。 检索引擎模块通过索引模块负责接收和满足来自用户的每一个请求。由于网页非常多,而用户往往只输入一个或两个关键词,导致检索结果总是很大,因此搜索引擎利用排序模块对检索到的结果进行排序。用户模块负责为用户检索提供友好的界面。 2. 网络多媒体信息检索 多媒体信息体现了人类最朴实的信息交流需求,直观、形象、内容丰富。网络多媒体信息包括了文本、图形、
39、图像、视频、音频等几乎所有非网络环境下的多媒体信息形式。 (1)基于文本方式的多媒体信息检索技术 首先对多媒体进行人工分析和抽取反映该多媒体物理特征和内容特征的关键词,然后对这些关键词进行文字著录或标引,建立类似于文本文献的标引著录数据库,从而将多媒体信息检索转变成对上述关键词的检索。检索关键字段主要有:文件扩展名(如gif、jpg、mpeg、avi、wav等);多媒体标题和文字解说;其他检索关键字段,如某些Web页的页标题、由人工选择或指定的某些标引多媒体信息内容的关键词等。 (2)基于内容特征的多媒体信息检索技术 主要依据是图像画面、声音和影像的内容特征。如图像画面的颜色、纹理、形状、结构
40、;声音的音频、响度、频宽、音色和节奏;影像的对象运动特征、颜色和光线的变化等。在组织多媒体信息时,组织者根据媒体的上述内容特征进行分析,建立基于内容特征的标引信息,将其存储在特征信息索引库中,并与实际多媒体数据联系起来。当用户检索时,系统一方面接受用户规定的图像画面、声音和影像的内容特征信息(即用户的检索提问),另一方面接受特征信息索引库中的特征信息,然后进行二者之间的匹配,以找出符合用户需求的多媒体信息。 信息检索效果评价 查全率:检出的相关文献量与系统文献库中相关文献总量的比率 查准率:检出的相关文献占所有检出文献的比率收录范围输出形式响应速度 四、信息分析与服务 信息分析的含义和作用 信
41、息分析的程序 信息分析方法和技术 信息分析的内容 信息服务 4.1信息分析的含义和作用 核心工作是根据特定需要,对情报信息进行定向选择和科学抽象。 所谓定向选择,就是根据特定需要进行的情报搜集和信息整序工作;所谓科学抽象,就是透过现象,揭示研究对象的本质、规律和联系的思维过程。 信息分析的作用 在科学决策中发挥参谋和智囊作用 在研究与开发中担负助手作用 在市场开拓中起保障和导向作用 在动态跟踪与监视中起耳目和预警作用思想库智囊团参谋尖兵耳目 4.2信息分析的程序 课题选择和计划 研究计划是行动的指南和纲领,是研究任务全面、系统的筹划和安排。有了研究计划,就有了工作目标,就可以把整个研究过程有机
42、地组织起来,保证研究工作有条不紊地顺利进行。 课题越大、时间越长、参加的单位和人员越多,就越需要一个周密而详细的研究计划。 信息搜集和处理 信息搜集是信息分析的基础。不论是何种类型的信息分析活动,都必须充分地占有信息“原料”。为了提高信息搜集效果,信息人员应遵循全面性、系统性、针对性、新颖性、可靠性、科学性、计划性等原则。 文献调查基于文献的信息搜集方法 社会调查一切以信息搜集为目的的社会实践活动的总称 信息处理经过搜集而获取的原生信息通常繁杂无序、真假混杂,因此需要进行处理。包括整理和评价。 其中,信息整理包括形式整理和内容整理,目的是使信息从无序变为有序,成为便于利用的形式;信息评价则强调
43、对整理出来的原生信息进行鉴别,一般依据可靠性、先进性、适用性等指标进行,目的是筛选出有用信息,淘汰掉无用或不良信息。 信息分析和提炼 信息通常不会天生就是财富。绝大多数原生信息只有通过加工处理和分析才能成为组织机构财富之源。 侧重于对信息进行精加工,是一项综合性很强的思维活动,它直接或间接调用人脑的思维功能,采用科学的方法、手段和工具,以揭示、总结、提炼和运用研究对象本身固有的本质的规律。 成果评价和推广应用 1)消息类成果。侧重于跟踪监视和及时报道特定领域的国内外发展的最新水平、动向和趋势,具有明显的推荐性质。特点是:内容简洁、新颖,报道迅速、及时。 2)数据类成果。以有关课题的各种系统的资
44、料或数据为主要对象,经过加工整理和分析研究所形成的一种成果形式,如“手册”、“汇编”、“指南”、“要览”、“年鉴”、“数据库”、“数据集”、“数据图表”等,具有密度高、系统性强、完整性和准确性好等特点。 3)研究报告类成果。以分析说明、归纳提炼、论证推测为宗旨,具有结构严谨、分析深刻、结论明确等特点。此类成果主要有综述性、述评性、预测性、评估性、背景性等几种类型。 信息分析成果的评价: (1)成立评价小组。由信息分析人员、相关领域的评审专家、主管部门负责人、用户等组成。 (2)确定评价目标。信息分析成果评价的基本目标在于确保成果质量合格,体现信息分析课题提出部门的意图。 (3)搜集资料,分析限
45、制性条件。以便进一步做出客观、公正、科学的评价结论。 (4)提出评价意见。包括概略性评价意见和详细评价意见两种。 (5)形成评价报告。要求以简洁的文字交代评价的目的、背景、时间、地点、专家、内容等,并详细地介绍评价的方法、过程及主要结论。 信息分析成果评价包括即时评价和最终评价。 即时评价:成果交付用户使用或以某种方式面世后,随即或稍后进行的一种评价。依据主要是成果本身的质量、所提供内容的内在价值和可使用价值以及用户对成果的初步反映。 最终评价:对成果使用后产生的最终效果进行的一种长远评价。依据主要是成果使用后给科技、经济、社会和环境带来的最终影响和后果。 信息从信源传递过来以后,用户首先要考虑的是如何理解、消化和吸收信息内容,在此基础上还要进一步考虑如何将其应用于科学决策、研究与开发、市场开拓等社会实践中去。 在成果推广应用过程中,信息分析机构对成果的宣传力度和解释透彻程度,用户本身已有的知识结构、经验、信息意识、消费心理、习惯偏好、经济承受力以及对信息内容的理解、消化和吸收能力等都会对推广应用的效果产生影响。 4.3信息分析方法和技术 对方法的合理选择和应用是决定信息分析水平和效率以及信息分析质量和效益的重要因素。 (一)逻辑思维法 比较:对照各个事物,以确定其间差异点和共同点。 分析:把客观事
链接地址:https://www.31ppt.com/p-1666560.html