《科学计量学概述.ppt》由会员分享,可在线阅读,更多相关《科学计量学概述.ppt(63页珍藏版)》请在三一办公上搜索。
1、科学计量学,姜吉栋,如何度量中国学者参与国际科技合作的能力?直接度量中国参与国际科技合作的能力有困难。,科学计量学概述科技统计与指标科技文献分布规律引文分析,概述,科学计量学(Scientometrics)的定义 科学计量学是对科学活动过程与管理实施量化评估、刻画和预测的科学学分支学科。科学计量学是指科学学研究中定量方面的问题。科学的科学(Science of Science),定义:科学计量学是用定量方法处理科学活动的投入,(如科研人员,科研经费),产出,(如论文数量,被引数量)和过程(信息传播和交流网络的形成)的研究领域。,科学计量学的发展历程纵观科学计量学的发展历程,可以大致分为三个阶段
2、。1.萌发时期(19世纪下半叶到20世纪初)代表人物:德堪多(Alphose de Candolle),高尔顿(Francis Galton),科尔(F.J.Cole)2.奠基时期(20世纪初到60年代末)代表人物:洛特卡(A.J.Lotka),齐夫,布拉福德(SamuelC.Bradford,加菲尔德(Eugene Garfied),普赖斯3.发展时期(20世纪70年代后)前苏联学者纳利莫夫(V.V.Nalimov,1910-1997)和穆利钦科(Z.M.Mulchenko)合著的第一部科学计量学著作科学计量学:把科学作为情报过程来研究科学的发展,有了英语“Scientometrics”这标
3、志着奠基期基本完成,从此跨入发展时期。,科学计量学在中国,1964年张琪玉、王恩光第一次向中国读者介绍美国科学引文索引吴尔中首次介绍核心期刊孟连生1982年硕士学位论文中文科学引文分析1995年出版中国科学引文索引(CSCI)靖钦恕线家秀首次提出“中国自然科学核心期刊”90年代,我国文献计量学研究和应用进入规模化、系统化、现代化的发展阶段。建立了一批具有相当数据规模和自主知识产权的文献计量评价系统和多种媒体形式的数据库。,赵红州、蒋国华、武夷山、邱均平、金碧辉、梁立明、山石、王祟德、罗式胜、陈文化、谷兴荣、刘则渊、官建成、朱东华等等一批数量虽然不多,但有些理论建树同样堪称国际一流的计量学研究专
4、家和学者,他们在不同的课题领域,诸如布拉福德定律研究、互引分析、大学科学水平评价研究,我国科技发展定量规律研究等方面,均做了很有意义的研究,并取得了重要成果。,科学计量学研究的内容,作为研究对象的科学之数量化的可能性和局限性 根据己掌握的各种数据,从不同的侧面建立各种科学计量指标模型,揭示科学发展的种种规律科学计量学在科学活动当中的广泛应用,科学计量学研究的工具和一般方法,数据来源(1)科技图书(2)科技期刊(3)科技报告(4)会议文献(5)专利文献(6)标准文献(7)学位论文(8)产品资料(9)技术档案(10)科技报纸(11)光盘数据(12)网络数据,科学计量学研究的工具和一般方法,SCI即
5、科学引文索引(Science Citation Index);SSCI即社会科学引文索引(Social Sciences Citation Index);A 中国期刊全文数据库及其引证报告。,科学计量学与文献计量学、信息计量学的关系分析,统计学,数据的收集、整理与描述数理统计的基本知识 统计推断 一元线性回归分析 时间序列分析,科技统计与指标,科技统计的概念科技统计是统计的分支,是用统计的方法对科学技术活动的规模和结构进行定量的测定。科技统计研究的对象是科学技术活动的总体的数量特征和数量关系,其主要任务是通过对科技活动的有关数据的收集、处理、分析,反映科技活动的规模、结构和布局的总体数量特征和
6、关系,从而为评价和制定科技政策和发展规划提供依据。,科技统计指标的定义,科技统计指标:用来说明科技活动某种总体现象数量特征的概念.科技统计指标体系:由全面反映科技活动所有总体特征的存在数量联系的系列统计指标组成的系统。我国科技统计核心总量指标是:投入研究与发展(R&D)活动的人员、资金、物质;专利、科技成果、论文、高技术贸易等。,科技文献统计指标应用案例,科技期刊评价指标科技期刊是反映科学技术产出水平的窗口,一个国家科技水平的高低可通过期刊的状况得以反映。总被引用次数:所评价期刊历年发表的论文在评价当年被其它期刊和该期刊本身引用的总次数,以表明该期刊在科学交流中被使用的程度。影响因子(Impa
7、ct Factor):可测度近年期刊的学术影响力。该项指标用论文平均被引率反映了期刊近期在科学发展和文献交流中所起的作用。定义:期刊前2年发表论文的被引次数占前2年论文总量的比例.公式:影响因子=某刊前两年发表的论文在该年的被引用次数/该刊前2年发表的论文的总数,扩散因子:评估期刊真实影响力的学术指标,显示总被引频次所涵盖的期刊范围。具体为该期刊当年每被引100次所涉及的期刊数。即年指标:是表征期刊即时反应速率的指标,即该期刊在评价当年发表的论文,每篇被引用的平均次数。公式:即年指标=该刊当年发表论文的总引用次数/该刊当年发表论文总数平均引文率:可测度期刊的平均引文(引证文献)水平,考察期刊论
8、文吸收他人学术思想的水平。平均引文率通常可以反映期刊吸收信息的能力以及科学交流程度的高低。定义:在给定的时间内,期刊篇均参考文献量公式:平均引文率=期刊参考文献总数/期刊论文总数期刊刊载的基金论文数:这是表明期刊所载论文学术水平和质量的一个重要指标,期刊载文的基金资助比例高,指示该刊学术水平较高。,期刊被引半衰期(cited halflife):可测度期刊文献老化的速度。文献的半衰期受学科的内容、性质等因素的制约。一般来说,比较稳定的学科,其期刊半衰期要比正在经历重大变化的学科,或者说发展较快、较活跃的学科的期刊半衰期长;基础理论学科的期刊半衰期要比技术学科的期刊半衰期长;历史悠久的学科期刊半
9、衰期要比新兴学科的期刊半衰期长。定义:某期刊现尚在被引用的全部论文中较新的一半的年代跨度。期刊的国际化程度:根据海外作者来稿数统计。国际著者论文数:指期刊发表外国作者论文的数量。可测度期刊在国内外学术交流中的作用。,还有很多其他指标:学科扩散指标;学科影响指标;文献选出率;标准规范化;论文平均发表周期;期刊他引率;编校质量等等。,科技论文评价指标,主要指标有:论文的类型;论文发表的期刊影响;文献发表的期刊的国际显示度;论文的基金资助情况;论文合著情况;论文的即年被引用情况;论文的合作者数;论文的参考文献数;论文的获奖情况等等。,科技文献的分布规律,科技文献的时间分布规律科技文献增长规律科技文献
10、老化规律科技文献的空间分布规律:布拉德福定律科技文献词频分布规律:齐夫定律 科技文献作者分布规律:洛特卡定律,文献增长规律,指数增长模型它描述了科学文献随时间增长的规律,即科学文献量的增长与时间成指数函数关系普赖斯曲线如果我们以文献量为纵轴,以历史年代为横轴,把各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可十分近似地表征文献随时间增长的规律。这就是著名的普赖斯曲线。,F(t)是时间t 的函数,表示t 时段的科技文献量;a 为条件常数,表示统计的初始时段(t=0)时的科技文献量;e为自然对数的底数(e=2.7138);b为时间常数,表示科技文献的年增长率r%。,指数增长
11、模型分析正确性正如普赖斯所指出“指数曲线的存在,显然具有普遍性和长期性。”因此,科学文献的指数增长定律具有较大程度的正确性,并获得了人们的公认。从数学上分析和从统计实例来看,指数函数正是科学文献量随时间而增长的数学表示,符合过去历史年代的科学文献统计结果。,局限性并不总是按指数函数关系增长 它与所研究的文献的学科和时间有关。事实上,文献指数增长曲线的陡度已有平缓趋势。不能预测未来 按照指数函数的变化规律,随着时间的推移,科学文献的增量会趋向无穷大。显然人类对科学研究的投入很难满足科学文献无限增长的要求。因此,这是不现实的。文献增长定律并不能完全反映科学的实际价值,文献增长定律只能提供粗略度量,
12、为了克服这些局限性,许多学者坚持探索更为精确的数学摸型和更为完善的理论解释。具有代表性的是“逻辑增长律”和“阶梯指数增长律”,都可以认为是从不同角度对文献指数增长律的修正。,它揭示了科学随着时间的延续而经历着一个“前期缓慢发展,中前期加速度发展,中后期减速度发展,直至后期饱和发展”的过程。,科学文献增长规律的应用,在科学学和科技评价中的应用 通过有关文献数量的统计分析,来揭示科学发展的某些特征和规律,是科技史和科学学研究中常用的方法和重要途径 评价学科所处的阶段、预测其未来的发展有重要作用在科技政策和管理中应用 为人才评价、流动和选拔使用,科技规划,奖励政策,分配政策和管理措施的制定等提供定量
13、依据,从而提高科技管理的科学化水平。在情报研究中的应用科学文献增长规律的研究是科技人员和情报人员开展情报分析研究、掌握科技发展动态、进行科学预测的理论指导和可靠手段。,科技文献老化规律,科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,越来越少被人们利用,甚至完全丧失其利用价值。,科技文献老化的原因-根本原因是科学知识的不断增长和更新原来不成熟的理论被比较成熟的理论所代替,不完善的方法为比较完善的方法所补充,不先进的技术被比较先进的技术所更新,错误片面的数据被比较客观的事实所校正文献中所含的情报已失效文献中的情报已包含在其他著作中被更新的文献所代替由于研究兴趣下降或
14、转移而引起有关文献的利用减少,科技文献老化的度量指标,半衰期 所谓文献的“半衰期”,是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的。普赖斯指数在某一知识领域内,把对年限不超过5 年的文献的引文数量与引文总量之比当作指标,用以量度文献的老化速度和程度,文献老化有很多数学模型,如负指数函数与老化方程,巴尔顿凯普勒老化方程,Brookes积累指数模型,阿弗拉米斯库(A.Avramescu)方程等等。用巴尔顿凯普勒老化方程计算出的各学科半衰期。,科技文献老化规律的应用 从文献利用率随时间流逝而衰减的角度揭示文献工作的规律和科学发展的特征 在文献情报管理中的应用 指导剔旧,
15、优化馆藏 解决书库空间危机提高文献检索效率有利于制定合理的文献工作原则有利于评价文献在科学学和科技史研究中的应用可以说明科学发展的速度,揭示科学发展的规律,反映出人类是怎样继承和发展科学知识的文献的老化与学科性质有关。根据文献老化的指标数据,可以判断学科的性质以及所处的发展阶段,科技文献的空间分布规律,产生背景,文献分散是普遍的客观现象一门学科的论文分散在其他学科的期刊杂志上屡见不鲜。如何找出其分散的规律性是关键所在科学统一性原则每一学科都或多或少地与其他任何一门学科相关联。对一个专家有用的论文,不仅出现在这个专家所在学科的专业期刊上,也可以出现在“其他学科”的期刊上。学科关系-文献关系?“其
16、他学科”期刊的数量,和其研究领域与“专家所在”的学科的关系密切程度以及“专家所在”学科的论文在每一种期刊中的刊登率呈反比。,按照某个学科论文期刊的载文率的高低划分区域,每个区域中的期刊数量随着该区域期刊载文率的减小而增多。,1933年,布拉德福收集了应用地球物理学和润化学两个学科领域内期刊上发表的论文,进行分析,发现第一区(核心区):数量不多但效率最高的P1种期刊第二区(相关区):数量较大,效率中等的P2种期刊第三区(边缘区):数量最大而效率最低的P3种期刊三个区域中的期刊数量关系n1:n2:n3=1:a:a2 a为布氏系数,布拉德福定律的文字描述如果将科技期刊按其刊载某专业论文数量多寡,以递
17、减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2.的关系。,布氏定律应用的主要领域,指导期刊采购工作确定“核心期刊”,为期刊选订提供依据考察专著的分布分析各个出版社关于某一学科或专业的著作出版情况,确定此学科的“核心出版社”,以指导图书馆的采购工作动态馆藏的维护可分析流通期刊的最小核心,以及核心读者所感兴趣的学科的最小核心,准确地为收藏服务,使馆藏保持为一种有序状态指导读者利用期刊以“核心期刊”的概念指导读者利用期刊,科技文献词频分布规律,齐普夫定律文字描述按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号
18、,即频次最高的词等级为1,频次次之的等级为2 频次最小的词等级为D(或L)。若用fr表示频次,r表示等级序号,则有,其中C为常数,齐普夫运用其“最省力法则”解释了这个定律。他认为,在任何语言中,凡是使用频率高的词,功能总是不会太大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就不大。所以,词的出现频率与等级序号的乘积基本上稳定于一个常数。,一般来说,齐普夫定律较符合西文文献中词频分布的实际情况,定量揭示文献信息的词频分布规律;词频分布问题是很复杂的,因而使得上述公式的适用范围有一定的局限性;一个r值只能对应一个f(r)值,因而说明文句中不能存在频率相同的词,这与客观事实是不符的。
19、,齐普夫定律的应用,自动标引本质在于利用计算机处理原文信息,将待处理的原文输入系统后,通过程序控制对每个词的频率进行统计分析,筛选出适于标引的词进行标引,或者与一个特定的分类体系进行比较,尔后分类处理。由于频率太高的词和频率太低的词在检索中价值都不会太大,所以都不能用于标引或表示应入类目,而要选用那些词频适当、功能较强的词来进行标引和分类。在整个处理过程中词频起着决定作用,而齐普夫定为这些工作奠定了有效的前提假设和理论基础。,齐普夫定律所使用的词频分析方法现在已经被越来越多地运用到科学评价和科技管理中来。比如说,运用关键词计量分析的方法展示一个学科领域的研究动向,就是一项很有价值的实证研究。,
20、科技文献作者分布规律,洛特卡定律在科学计量学方面,它是指在某一时期内、某一主题领域内,文献作者的分布状况洛特卡选取化学和物理学这两大学科内的部分科学家及其著作作为研究对象:对化学文摘(1907-1916年)累积索引中姓名以A、B两字母开头的所有著者。德国著名学者奥尔巴赫(Auerbach)所编物理学史一览表中的人名索引中所含的著者的著文数情况进行研究。,洛特卡定律的限制学科之间的性质差异,导致了不同学科作者著述行为的差异,从而对洛特卡定律在不同领域的应用产生影响。对高产作者缺乏深入研究对合著者情况处理略显简单,洛特卡定律的应用,在科学生产率研究中的应用运用洛特卡定律对论文作者的著述行为进行研究
21、,从定量的角度揭示出科研工作者的科学生产能力,或对某些领域科研工作者或科学共同体的科学生产能力进行比较和评价,是洛特卡定律应用的一个重要方面。在预测科学中的应用运用洛特卡定律可以通过对著者数量的估算预测科学论文的数量和增长情况,或者反之。由此,可以预测学科发展的方向。为人才需求和科研资金的投入提供依据。在科学学和人才学方面的应用洛特卡定律可以用来研究科学工作者的活动规律,揭示杰出科学家的数量分布特征,定量研究科学学规律,为人们研究科学史的发展特征提供依据。,引文分析方法,利用各种数学及统计学的方法和比较、归 纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分
22、析,以揭示其数量特征和内在规律.,施引方面 每篇论文平均引证参考文献数目是15篇,其中13篇是期刊论文,而另2篇是图书等其他类型参考文献。普赖斯估算,如果世界文献量每年以7%的速度增加,那么,100篇论文会有105篇引文。即每篇论文每年差不多被引用1次多一点。被引方面 在任何一年里,大约有35%的论文不曾被任何文献引用,有49%的论文只被引用1次,所余的16%的论文平均被引用3.2次。其中,大约9%的论文被引用2次,3%的论文被引用3次,2%的被引用4次,1%的被引5次,余下的1%被引5次以上。结论:被引的减少比引用的减少要快,引文与引文分析可以提供什么?,被引文献检索(Cited Refer
23、ence Search):谁引用这篇论文?引用这篇论文的文献讲了些什么?论文之间的引文连接:反映了科学交流的网络、结构及其随时间的变化、学科间的互动引文统计作为一种文献计量和科学计量的指标,告诉分析人员首先应该关注什么学科上的相关性:理论与方法,借鉴与利用,技术与手段,应用与发展横向上的对应性:实验或方法,互相参照与借鉴,结果与讨论,比较与应用纵向上的继承性:课题的基础与起源.发展与进步论文的相互引证揭示科学研究背后的联系与发展,引文分析主要内容引文年代分析引文量分析引文的集中与离散规律分析引文类型分析引文语种分析引文国别分析,引文分析主要指标,1.自引率 在引用文献的过程中,限于主体本身范围
24、内的引用称之为“自引”。包括同一类学科文献的自引、同一期刊文献的自引、同一著者文献的自引、同一机构文献的自引、同一种文献的自引、同一时期文献的自引、同一地区文献的自引。自引率就是对主体本身范围内文献引用的次数与主体引用的文献总数的比值。2.被自引率:这是被引用现象的一个测度,被自引率就是主体文献被自引的次数与主体被引用的总次数的比值。它反映出被引用中有多少是被自己引用的。3.影响因子:主要在研究科技期刊时使用,等于期刊在规定时间内(一般是两年)论文被引量与可引论文总数之比。4.引证率:期刊引证率等于该刊中参考文献量除以期刊载文量。这是衡量吸收文献能力的一个相对指标。,5.即时指标:这是测度期刊
25、被引用速度的指标,它是期刊某年发表的论文当年被引用的次数,除以该刊这一年所发表文章的总数,是衡量期刊重要性的一种依据。6.引文耦合:当两篇文章同时引用一篇或多篇相同的文献时,这种现象称引文耦合,这两篇文献就具有耦合关系。引文耦合的文献之间总存在着这样或那样的联系,其联系的程度称为耦合强度。7.同被引:当两篇(多篇)论文同时被别的论文引用时,则称这两篇论文具有“同被引”关系,引用它们的论文的多少,即同被引程度,称为同被引强度。,引文分析的基本步骤,选取统计对象 根据所要研究的学科的具体情况,选择该学科中有代表性的权威 的杂志,确定干期及干篇相关论文作为统计的对象 统计引文数据 在选取的论文中,分
26、项统计每篇论文后面的引文数、出版代、语种、类型,论文作者的自引 统计项目可依据研究的目的和要求自确定引文分析 根据研究的目的,从引文指标或其它角进分析作出结论 根据引文分析原和其它一般原则进判断和预测,作出相对应的分析结论,引文分析应用领域,1.测定学科的影响和重要性:通过文献引用频率的分析研究可以测定某一学科的影响和某一国家某些学科的重要性2.研究学科结构:通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体;分析推测学科间的交叉、渗透和衍生趋势;还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示
27、科学的动态结构和某些发展规律。3.研究学科信息源分布:通过文献间的相互引证关系,分析某学科(或专业)文献的参考文献的来源和学科特性,不仅可以了解该学科与哪些学科有联系,而且还能探明其信息的来源及分布特征,从而为制定本学科的信息管理方案和发展规划提供依据。,4.确定核心期刊 从文献被利用的角度来评价和选择期刊的,比较客观。5.研究文献老化规律:目前,有关文献老化的研究一般是从文献被利用角度出发的。6.研究信息用户的需求特点7.评价人才,科学计量学研究进展,h指数(highly cited index)美国加州大学圣地亚哥分校物理系教授于2005年提出,提高评价结果的客观公正性 主张在评价科学家个人绩效时应对产出论文的质量和论文数量作综合考虑,评价指标既要体现质量,又要体现数量。,h指数是根据论文的“质”和“量”两个方面确定的具有创新的指标。h指数高不仅表明评价对象发表质量高,而且高质量的论文数量也多,因而弥补了传统科学计量学单项数量指标只能体现数量的缺憾。,谢谢 请多指正!,
链接地址:https://www.31ppt.com/p-5295968.html