《文献计量学方法》PPT课件.ppt
1,4 文献计量学方法,2,4.1文献计量学概述文献计量学的发展历史文献计量学的特点4.2文献计量学方法文献计量学方法的基础引文分析方法文献计量学方法的类型文献计量学方法的特点文献计量学方法的应用4.3网络计量学,3,4.1文献计量学概述,文献计量学的发展历史 Bibliometrics, Scientometrics, Informetrics,文献计量学,科学计量学,信息计量学,1926年,洛特卡(A.J.Lotka)定律1927年,格罗斯(Gross),第一次引文分析1934年,布拉德福(S.C.Bradford)文献分布规律1935年,齐普夫(G.K.Zipf)词频分布定律,1969年,普里查德(A.Pritchard)发表了统计书目学还是文献计量学一文,首次提出了“文献计量学”这一概念。,4,三计学的联系与区别,5,文献计量学 文献计量学是以文献体系和文献相关媒介为研究对象,采用数学、统计学等的计量方法,研究文献信息的分布、结构、数量关系、规律,并进而探讨科学技术的某些结构、特征和规律的一门学科。简言之,就是应用数学、统计学等方法对文献情报进行定量分析研究的科学。,6,文献计量学的特点研究内容主要是文献情报流的机理探讨。用定量化方法对文献特征进行分析处理。以文献的若干基本定律和规律为基础进行文献分布研究。,7,4.2文献计量学方法,文献信息流:在文献信息计量学中,文献所含信息(情报) 的汇流。文献信息流具有静态特性和动态特性。静态特性:在一定时间内科学文献或其特征信息在空间的分布性质,如学科论文在期刊中的集中与离散分布、文献按作者分布、词汇在文献中分布、引文分布、文献内容单元(关键词) 分布、主题相关分布等的规律性等。动态特性:指科学文献或其特征信息随时间的延续而增长和老化的性质。,8,文献计量学方法的基础文献增长定律文献老化定律文献作者分布理论洛特卡定律文献分散理论布拉德福定律词频分布理论齐普夫定律,9,文献增长定律,文献是科学技术成果主要表现形式之一,新出版的文献数量随时间的变化而增长的现象为文献的增长。,文献增长定律的数学表达形式为:Ff(t),10,普赖斯曲线 F(t)aebtF(t)某年(t)的文献累积数量;t时间(以年为单位); b为文献持续增长率,即每一年的文献增长率。a统计初始时刻的文献量,评价文献增长速度的定量标准: 文献量增加一倍所需的时间(倍增期),dln2/b,11,逻辑曲线方程式: F(t)t年的文献累积量; KF(t)增长的最大值; a与b为参数。,F(t),t,t,12,文献信息老化规律,所谓科学文献老化系指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。,13,文献信息老化的量度指标量度指标半衰期(Half-Life) 所谓文献的“半衰期”,是指某学科(专业) 现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的。普赖斯指数(Price Index) 是出版年限不超过5年(相对于被统计论文发表年)的被引文献量与被引文献总量之比。,14,文献老化的数学模型负指数模型 C(t)Ke-at C(t)是引用的文献之中t年以前所发表的论文数量; K为常数,随不同学科而异; a表示老化率(a1)。巴凯方程 a,b 为系数,ab=1 Y为一定时期内,总的引文比率(Y1); x为时间(以10年计)。,15,文献作者分布理论洛特卡定律,洛特卡定律的基础科学生产率概念 “科学生产率” (Scientific Productivity) 是指科学家(科研人员)在科学上所表现出的能力和工作效率,通常用其生产的科学文献的数量来衡量。,16,洛氏定律的基本内容 设f (x) 为写了x 篇论文的作者数占作者总数的比例,则洛特卡定律可表示为 : C 为某主题领域的特征常数。,17,洛特卡定律的发展洛氏分布一般公式的研究洛氏定律适用性的研究洛氏分布机理的研究普赖斯定律与重要推论,18,所谓普赖斯定律(Price Law) ,即科学家总人数开平方,所得到的人数撰写了全部科学论文的50%。可用下式表示:,式中,nmax最高产的那位科学家所发表的论文数; x(1,nmax) 科学家们发表论文的总数,R是杰出科学家人数与全体科学家总数之比,推论1,推论2,19,洛特卡定律的应用在情报学图书馆学方面的应用在预测科学方面的应用在科学学和人才学方面的应用,20,文献信息离散分布规律 布拉德福定律,布氏定律的形成和基本内容布氏定律的形成和确立 专门学科的情报源(Sources of Information on Specific Subject) (1934年1月工程(Engineering) 周刊的“图书与文献”栏目),首次公开提出定量描述文献分散规律的经验定律。,21,布氏定律的基本内容区域描述。 如果将科学期刊按其登载某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成1 : a : a2 的关系。 a布拉德福常数,或称比例系数。,22,图像描述。,23,词频分布规律齐普夫定律,齐普夫定律的基本内容 如果把一篇较长文章(约5000字以上)中的每个不同的词按其出现频次f的递减顺序排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号r,出现频次最高的为1级,其次为2级一直到L级,那么等级值和频次值的乘积是一个常数,即: f*r=C 其中f表示某个词在文章中出现的频次,r表示该词的等级序号,c为常数。,公式仅仅对中频、中序的词才是有效的。,24,引文分析方法,引文分析方法概述引文分析方法的理论基础引文分析方法的基本内容及类型引文分析方法的类型,基本内容,特点及局限引文分析方法的使用范围引文分析方法的测度指标,应用领域引文分析方法的主要工具引文分析方法应用举例,25,引文分析方法概述引文分析方法的概念 引文分析方法就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。,26,引文分析方法的理论基础 文献的相互引用是由科学发展的规律和科学研究活动的规律所决定的。文献之间的这种引用关系是文献与文献之间知识转移的痕迹,这就是引文分析方法得以建立的理论基础。 引文测度是一种统计意义的宏观测度,是对被分析对象整体的考察。,27,引文分析方法的基本内容及类型 引文分析方法的类型如果从获取引文数据的方式来看,有直接法和间接法之分。如果从分析的出发点和内容来看,引文分析大致有三种基本类型:引文数量分析、引文网状分析、引文链状分析。,28,引文分析方法的基本内容引文年代分析引文量分析引文的集中与离散规律分析 引文类型分析引文语种分析引文国别分析,29,引文分析方法的特点及局限优点广泛适用简便易用功能独特 局限引文关系上假联系的影响文献被引用并不完全等于重要著者选用引文受到可获得性的影响马太效应的影响,30,引文分析方法的使用范围引文分析方法的测度指标自引率:被自引率:,31,影响因子: 引证率: 即时指标:,32,引文耦合 当两篇文章同时引用一篇或多篇相同的文献时,这种现象称引文耦合,这两篇文献就具有耦合关系。 同被引 当两篇(多篇)论文同时被别的论文引用时,则称这两篇论文具有“同被引”关系。,33,引文分析方法的应用领域 测定学科的影响和重要性 研究学科结构 研究学科信息源分布 确定核心期刊 研究文献老化规律 研究信息用户的需求特点 评价人才,34,引文分析方法的主要工具 科学引文索引(SCI), 社会科学引文索引 (SSCI) 期刊引证报告 (JCR) 以SCI为例,由5种索引构成:作者引文索引、专利引文索引、轮排主题索引、团体引文索引和来源索引。,35,著者引文索引:是由被引证文献著者姓名查找引证该文献的新著者及其文献题目的索引。 专利引文索引:收录所有被引证过的专利,并揭示各篇专利被他人引证的次数。 轮排主题索引:为一种题内关键词索引。 团体引文索引:团体专指来源著者的工作单位由地理与机构两部分构成, 来源索引:是将著者引文索引、专利引文索引和团体索引中可查到引文的著者及其所发表论文或专利的出处与发表年份等,资料所属类型,一律按著者姓名英文字顺排列。,36,引文分析方法应用举例资料来源与研究方法引文的统计分析:引文的数量,学科,文献类型,引文的语种,年代,引文期刊分布,期刊自引率作者的统计分析作者人数分布,平均作者数分布,作者的系统分布、地区分布,作者的合著类型分布,37,10种期刊引文量统计(1989-1991),引文的统计分析引文的数量,38,引文的统计分析引文的学科 10种环境科学期刊引文共涉及40多个学科,其中引自环境科学文献占56.20,其它自然科学文献占41.27社会科学文献占1.40综合学科文献占1.23,39,引文的统计分析引文的文献类型,40,引文的统计分析引文的语种,41,引文的统计分析引文的年代,最大引文年限,半衰期,42,引文的统计分析引文期刊分布,43,引文的统计分析期刊自引率,自然科学期刊自引率5-10%,44,作者的统计分析作者人数分布,64.71%,45,作者的统计分析平均作者数分布 10种期刊作者共6264人次,篇平均作者2.42人。低于中国科学(B)的3.27人,物理学报的3.11人,化学学报的3.45人高于地质学报的l.83人,计算机学报的1.75人和数学学报的1.24人。,46,作者的统计分析作者的系统分布,47,作者的统计分析作者的地区分布,66.6%,48,作者的统计分析作者合著类型分布,49,文献计量学方法的类型,文献计量学方法按研究手段可分为文献统计分析法、数学模型分析法、系统分析法、矩阵分析法、网络分析法等。文献统计分析方法 利用统计学方法对文献进行统计分析,以数据来描述和揭示文献的数量特征和变化规律,从而达到一定研究目的的一种分析研究方法。,50,文献统计的媒介:各种类型的书目、索引、文摘;期刊杂志;期刊指南和联合目录;评述性杂志及其它出版物;与文献利用情况有关的读者借阅单、阅览登记资料等等 。,51,文献统计分析的主要内容对各种各样的文献进行统计与分析;著者数的统计与分析;科学术语的统计与分析;引证关系的统计与分析;读者的统计与分析;文献利用情况的统计与分析等等。,52,文献统计分析的步骤: 统计调查 统计整理 统计分析,53,4.2.4 文献计量学方法的特点,突出了信息分析研究的信息特色 能其它方法之所不能 计量元素好辨别、易收集 研究者毋须有深广的专业背景知识,54,55,56,文献计量学方法的计量元素,57,文献计量学方法的计量元素(续),58,4.2.5文献计量学方法的应用,文献计量学方法的应用测定核心期刊指导信息收藏管理测定检索工具的完整性指导用户利用期刊研究信息利用规律研究科学发展的特点预测学科发展,59,文献计量学方法应用综合举例 运用文献计量学方法分析世界和中国医学信息学发展的状况。 统计数据来源:MEBLINE光盘统计方法:利用主题词表,检索医学信息学的全部文献,按年代分为10组;在各组文献中,进行主题、副主题检索,获取医学信息学各研究领域的不同文献;获取医学信息学文献的不同类型、语种和出版国家;所有检索结果均输入VFP数据库,分别从各国文献的不同方面进行计量和主题分析。,60,1987-1996年医学信息学文献数量的变化,61,语种分布,62,学科领域,63,64,核心期刊表,65,4.3 网络信息计量学,网络信息计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存贮、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。,66,网络计量学的基本特征首先,网络计量学作为文献计量学的新的发展方向,其研究内容侧重于网络环境下的信息资源和信息媒介及功能。其次,同文献计量学一样,网络计量学使用大量的概率论和统计学。再次,网络计量学的目的是为网络信息资源的优化配置和有效利用、网络资源管理的科学和规范提供定量的依据。,67,网络计量学的研究对象 主要是Internet提供的站点、主页、E-mail、讨论新闻组等媒介和内容。网络计量学的研究方法运用统计方法对数据进行统计分析 链接分析法 运用揭示数据聚簇和分散的工具进行数据挖掘研究 运用能解释和模拟网络结构和增长的理论工具进行模型研究,68,网络计量学的研究数据的可靠与否取决于采集工具 网络计量学的实际应用网络资源管理中的应用电子核心期刊评价中的应用数字图书馆资源建设中的应用,69,End,