(图灵指数)学术大数据下的跨领域跨年代学者影响力评估.docx
随着学术界规模的扩大,面对领域和年代的巨大差异,现有的衡量学者影响力的量化指标很难消除偏差,从而进行准确衡量。通过观察18652016年、310个领域、14223183位学者、126438664篇论文和533556856次引用的数据集,得出不同领域、不同年代的新增引用量分布均遵循累律分布,因此提出图灵指数,通过归一化消除指数膨胀的影响,衡量学者的绝对影响力。通过对诺贝尔奖、菲尔兹奖、图灵奖等获得者的图灵指数的比较发现,尽管他们在领域和年代上存在很大差异,但是在各自领域却有着相似的影响力。图灵指数为跨领域、跨年代学者影响力评估提供了全新的思路,也为国内外学者影响力评估和基金审理提供了参考。1引言目前,越来越多的人投身于学术界,并在众多研究领域取得成就。如何量化众多学者的影响力已引起了全世界的关注,对学者影响力进行评估,对基金项目进行评审和学术奖项评选等都有很重要的意义,可以推动学术界进一步的发展。目前,最广泛使用的评价指标是引用量,即学者发表论文的总被引用次数。另一个广泛使用的指标是H指数,它根据研究者被引用最多的论文数目和被引用次数来衡量学者的产出和影响力。上述两种方法均未考虑领域和年代的影响,研究人员基于引用量和H指数提出了一些变体,用于衡量学者的个人水平。随着时间的推移,出现了很多解决学术影响力量化问题的方法。由于领域本身的迅速发展和不同领域的不平衡发展,一些工作分别考虑了不同年代、不同领域对影响力量化的影响,并且基于引用量和H指数的归一化来平衡不同年代、不同领域学者的相对位置。在消除年代和领域的影响时,这些指标都没有合理考虑学术界规模迅速扩大造成的影响,导致评估结果并不理想。2学术界的指数膨胀为了对不同领域、不同年代的学者进行影响力评估,笔者对学者和论文数据进行了统计和收集,数据来源于ACemaP和微软学术。微软学术利用论文发表期刊、标题和正文等信息对论文所在领域进行层次划分,划分结果得到了学术界和工业界的广泛认可。本文利用ACem叩整合微软学术从1865年到2016年的310个领域、14223183位学者、126438664篇论文和533556856次引用的数据集,进行学者影响力评估的探索。主要领域的学者、论文和引用量等统计结果见表Io»1敬密集主要领域信总燎计主要领域检文教/结引J11fit次学者数/位子领域数/个时间政治学2294741307131749082S019282016年药学659383647987676699626167518752016年哲学13673949352141321093166518742016年化学771726755106936262877352218652016年羟济学392878228015103313730234919062016年历史学62035539064172746965618902016年数学790995058A5640547308802518892016年生物学77514835619200703831641741&W2016年计算机科学751284957184995474060518118892016年材料科学25538601854914232512094519022016年社会学310788221307422755201204818972016年地质学262446318735592570621212018952016年心理学435457731459854278842243018972016年环境科学44141028935558557017819012016年物理学947169867077466142982662018652016年工程学581925943237804374996268918H92016年艺术学45627132050854«78542219102016年地理学57123342377966579050219122016年衅1086437767941115116453618942016年如图1所示,历年新增论文、引用量和学者数目均呈指数级增长,可以看出学术界在飞速发展。从图1可以看到两个明显的凹陷,分别在1917年和1941年左右。笔者认为这是由两次世界大战造成的,可见军事对科学研究也会产生很大影响。图1历年新增论文、引用量和学者数目统计本文对各个主要领域内部的发展情况进行了统计,如图2所示,不同领域由于发展情况不同,线条的斜率和截距不同,但均呈指数增长。其中C为引用量。图3显示了指数膨胀的学术网络,图3中红线表示每年活跃学者的数量,网络中的彩色节点表示不同领域的活跃学者,每个簇代表一个领域,可见领域的膨胀是非常迅速的。图4为从1950-2014年16个物理子领域的历年引用量增长情况,该领域内部的子领域发展也是不均衡的。×1071960年2000年1980年 年份图3学术网络指数膨胀可视化×,K遍生n2010年2006年2002年1998年1994年-19901986年1982年-1978年一1974本197。年1966年1962庠一1958年-1954年1950年图4物理子领域历年引用量增长3指数膨胀效应对学者影响力评估的影响随着学术界的指数膨胀,发表更多的文章、获得更多的引用量变得更加容易,在这种情况下,以往的文献引用和H指数等指标无法很好地描述学者在以下3种指数膨胀效应下的影响。一是时间的膨胀效应。学者在不同时期的相同引用量是不等价的。由于学者和论文数量不断增加,现在的学者论文更容易被引用。1980年被引用1()()次的学者可能比2018年被引用100次的学者具有更高的影响力。同样,H指数也没有充分考虑时间效应。因此,仅仅采用引用量或H指数可能会导致一种错误的判断,即年长的学术巨头和年轻的学者对学术界具有相同的影响力。二是领域的膨胀效应。一个重要但通常被忽视的因素是研究领域发展水平不均衡带来的影响。虽然不同领域的引用量均呈指数增长,但其膨胀速度和状态不同,发展水平也不同。例如,生物学的年总被引次数大约是政治学的40倍。图3给出了活跃学者在不同领域的膨胀情况,领域的大小按照它们自己的节奏发展,即使在单个领域(如图4所示的物理学领域),其子领域的发展水平也是完全不同的。拥有相同引用量的不同领域的学者,他们在各自领域的影响力是不相等的。在蓬勃发展的热门领域和在小众领域得到相同的引用量是不等价的。三是年代的膨胀效应。即使在同一时间、同一领域内拥有相同的引用量和H指数,但在学者们活跃年代不同的情况下,他们的影响力也可能存在差异。活跃年代是指学者在所属领域内被引频次数快速增长的时期。如图5所示,威廉菲利普斯和迈克尔弗莱施豪尔是量子光学领域的两位杰出物理学家。根据谷歌学术统计,截至2018年,威廉菲利普斯共获得引用23750次,H指数为66,而迈克尔弗莱施豪尔的被引用次数和H指数分别为21578次和60o虽然他们有相似的引用和H指数,但威廉菲利普斯(活跃年代为20世纪90年代)比迈克尔弗莱施豪尔(活跃年代为21世纪初)有更早的活跃年代。也就是说,在一个全新的、学者较少的领域获得相同的引用通常比在一个成熟的领域难得多,而且领域的开创者比追随者影响力更大。因此,目前威廉菲利普斯对量子光学的影响大于迈克尔弗莱施豪尔,而实际中,威廉菲利普斯获得了诺贝尔物理学奖,也验证了本文的观察。图5两学者历年新增引用量比较然而,上述观察中得出的结论主要是基于人的主观经验。那么是否有一个量化指标可以消除领域和年代的膨胀效应,为学者提供科学客观的评价?作为一种大胆而又严谨的尝试,本文提出一种新的度量标准,即图灵指数(TUringindex),以重新评估学者的影响。4图灵指数为了消除不同领域、不同年代对学者影响力评价的影响,本文首先研究了各个领域每年学者的新增学者引用量分布,即学者的数量与特定年份内相应增加的引用分布情况。为了寻找合适的量化指标,本文从数据集中提取数据,并绘制历年学者新增引用量分布图。图6为2015年物理领域的引文网络,图6中每个节点代表2015年在物理领域发表或引用论文的活跃学者,红色节点的度数较高,绿色节点的度数较低,从图6可以看出,极少数红色节点被绿色节点包围,由此笔者猜想引用量分布符合累律分布,即红色节点获得大部分的引用次数,大多数的绿色节点被引用次数则少得多。为了验证这一猜想,基于对每年论文的新增引用量和这些论文的所属学者和领域,本文计算出1228960765条四元组,每一条四元组都由学者、领域、年份和引用组成,表示每年每个学者在不同领域的新增引用。图62015年物理领域学者引文网络利用四元组,本文用对数图绘制学者的引用量分布情况,如图7所示,尽管不同领域的学者数量不同,但这些引用量分布都可以通过线性函数很好地拟合,说明它们都遵循事律分布,其形式如式(1)所示。n=N(k-l)ck(1)其中,n表示每年被引用次数增加数值为C的学者数目,N为当年被引用的活跃学者总数,k为比例指数。引用量分布的归一化是为了让不同慕律分布公式符合相同的参数。为此,本文假定目标归一化领域ft)有NO个学者和标度系数k,同时引用量为Co的学者有NO个,那么其引用分布为:no=M>(-l)c0*°(2)同样,本文假设未归一化领域fi(iZl)的引用分布为:ni=Ni(ki-1)ci*'(3)为了使领域fi具有与领域f相同的分布,本文需要在ni=n时,使得新增引用量Ci归一化为c,其中,c表示在领域fi中引用量为Ci的学者P归一化后在领域f中的绝对位置。然后有:Ni(ki-l)c=N0(k0-l)cnki(4)因为NO和k是常量,所以有:幺QoCrlT=7¾-0rM%(*l-卢In<(a)社会学和物理学较域(0经济学和计算机科学领域图7不同领域不同年代新增引用量分布情况其中,=o针对归一化,本文将CO作为学者的影响力I,学者P在该领域的成就可表示为:Adlk(6)领域通胀水平为:D=Na(k-l)a(7)领域的k值越高,则在该领域越难得到同样的引用量c,因此,相同引用量产生的影响力越大。活跃学者人数N的增加导致领域通胀水平D的增加,从而刻画指数膨胀效应。是一个常量,可以看作一个平衡项,以防止归一化度量的欠收敛和过收敛。图8显示了在3种情况下,领域和年代的归一化过程:相同年代不同领域、不同年代相同领域、不同年代不同领域。归一化后,不同领域、不同年代的引用量分布基本一致。基于式(5)和提出的指标A和D,学者P在领域f从S年到t年的总影响力的图灵指数Tp,f,t为:九=i(¢)生物学与匚稗学领域(0经济学与计算机科学领域图8不同领域不同年代新增引用量分布归化结果利用式(8),可以在相同条件下评估跨领域和跨年代学者的影响。5跨领域、跨年代学者影响力对比本文建立了一个基于数据集的系统来计算和存储不同领域和不同年代学者的图灵指数。一个学者可以属于多个领域,通过对每年增加的引用量进行归一化处理,本文得到了1228960765条包含学者、领域、年份和图灵指数信息的四元组。为了更好地理解图灵指数如何消除通胀差异、评估不同领域不同年代的学者的影响力,本文分别基于引用量和图灵指数衡量诺贝尔奖、菲尔兹奖和图灵奖得主的影响力,并进行比较。截至2015年入选学者的获奖统计数据见表2。«2学者获奖统计姓名获奖名称年份贡赋引用量/次图灵指数AriehWarshel塔贝尔化学奖2013年豆杂化学系统32222254BarbaraMcclintock诺贝尔生理学或医学奖1983年可移动速传因子38092245BruceBeutler塔贝尔生理学或医学箕2011年先天免发活化156504558EdmundMClarke图灵奖2007年模型检查13A82607«EricBetzig诺贝尔化学奖2014年灵光显Ut镜64224509JeanTirole诺贝尔羟济学奖2013年巾场权力及规管30315650JohannDeisenhofer塔贝尔化学奖1988年光合作用中心56963662JohnEHopcroft图灵奖1986年轼法投计84496020OliverEWilliamson诺贝尔经侪学奖2009年经济治理51315237PaulNurse诺贝尔生理学或感学奖2001年和跑周期调节器110482613PierrelouisLions再尔投奖1994年偏微分方程39082747RalphMSteinman诺贝尔生Bl学或医学奖2011年用突蒯MS186835820RoaldHoffmann雷贝尔化学奖1981年化学反应过周17372261ShujiNakamura诺贝尔物理学奖2014年筮色发光二极管44122832SusumuTonegawa诺贝尔生理学或医学奖1987年抗体的多样性174195150SydneyBrenner诺贝尔生理学或医学奖2002年壁因调控68962125TerenceTao派尔及奖2006年偏微分方程97063750本文对相同年代不同领域、不同年代相同领域和不同年代不同领域这3种情况进行对比。(1)相同年代不同领域相同年代意味着相关学者的研究生涯大致是在同一时期开始的,引用量的增长速度因领域而异。由于一个领域的学者数量可能是另一个领域的30倍,所以领域的发展水平可能会形成巨大的对比。从图9(a)和图9(b)可以看出,诺贝尔生理学奖得主PaulNurse和菲尔兹奖得主PierrelouisLionS之间引用量的显著差异并不意味着他们的影响力存在巨大差距,因为他们在不同的领域。对各自历年新增引用量进行归一化处理后,两位学者的图灵指数表明,他们对各自领域的影响是相当的,发展轨迹也几乎相同。同样现象也出现在图9(C)和图9(d)中,其中,诺贝尔生理学奖获得者RalphMSteinma在免疫学这一庞大的领域中被引用的次数较多,而诺贝尔经济学奖获得者JeanTirole在工业管理这一领域中被引用的次数较少。通过引用量分析,Steinma的影响力似乎比TirOle大得多,但图灵指数显示两者的影响力相同,甚至轨迹相同。另一个发现是,由于领域迅速发展导致的膨胀,学者们可能会遵循不同的发展模式,这些发展模式无法在传统的总引用量衡量中体现。例如,在图9(e)和图9(f)中,BnICeBeUUer的图灵指数呈线性稳步增长,而EriCBetZig在开始发展时较平缓,1992年后出现了一个跳跃,这说明他可能在那一年取得了很大的突破。这一观察可以被证实,在1992年,EriCBetZig发表了一篇关于显微镜的论文,而这是他获得诺贝尔奖的主要贡献。*7亭i9XF .201 稣保伶(») Ptui NurvcFc*d<a) Li<*m 【相ISI用比器里HXt IQg年 20Wf 3t>e<F 年脩(b) Pwl NuncR><rckM I «om历WM尺用散“比希果l<W- 0WfytW<tr 201OV "伶(c) n7rcfllUJph 1 Stcatrmii 历年;Ht!H,比第Jft车xIMO年 180年 MOMf 年份(d) w TiMcfBlUIpI' M Sic«r«M«历年留必所做“比站柔I99O MO”, SOlMr 保饰(e> Rr RcwiM和FCt Bcizig 历彳司刑UH匕M果20COr 20IOr<rttMS.=F(0 RruccBcfdFzRcJ”吻&阻其箭RW比格果ototr I(W¥ 2<xw 200<r 中伶1的Og wy. 2000年 JUI<K'(0 ArichWHidMRmoffteE场年方姗w比的Z(j) Artch WMMKcM HcifThiVWWq-1iftMttt%lIW冷I晒向、似用2Cwr 年份(r») SM dnw"CM Ne 历二小阳蝌对比站出):、,匚10IOMMr 博怀年 20CO 201 CW0<) 91vi NiKAmiiM!Rul Nurc 3j ffi XHiM MltM !C191MWr <wo, ><, 2oOocOoc期 6 4 2 H(f) JOhnFHope>而和RbidMMn<¾e 4年引IIJN “叱M央I91ff 990<r 2«IIMr 20l(XfWO(h) F Hopcwh4F4rr<lnd M Clnr¼eJj 4阳美西改“比”来IaWy Iol)Ow MOW 3o(r2 1 I 0m13H ITOVHQCKr200彳年怜(k> S<k> B<cmxiSut>Mt MCdifU2 <l> Sv(Jc BlCnnaIllBeitMfa Mcliock历年引MaM比5豪OjWXft<K>! wslpl*>7(Xt IWrI98年 2000 年力1姆 年伶舜王一SKM(% IOOCHf MOg SOIO' ¥»<O) OtrVCf(- WilhnIwf和SuMimu TtKft*A9)OIiErWIgGyIe 和IOOCOi<G; c.TSOU -.:J-.5«02 SCMIOeo午 IgoCr NXXXr 2010午IalC彳 1990< XWO年 2f)IO<flhft* fk<*Mir k KACtf TaoIOhi. kwc*ho, " "lvra Tnr好像(q>JoIuflDDc<5<nho(cfftlTevcnceT>(r)JoMnnDciKnhuGrRrTEiKcTs历卬或用用拶比站累15年朋NIS数灯比站聚图9学者的引用量和图灵指数对比结果(3)不同年代不同领域同样地,当同时考虑领域和年代时,影响力的度量也遵循同样的规则,但是有更多的比较形式。如图9(m)和图9(n)所示,诺贝尔生理学奖得主PaUlNUrSe比诺贝尔物理学奖得主ShUjiNakamUra有更早的活跃年代,被引用的次数也更多。虽然较早的年代和较高的引用量表明较高的影响,但是PaUlNUrSe的所属领域要比NakamUra的所属领域大,根据图灵指数,这两位学者有着相似的影响力。另一种相反的情况如图9(o)和图9(p)所示,OliverEWilliams有更早的活跃年代,并且所在领域比SusumuTonegawa的领域小,OliverEWilliams的引用量仅为SusumuTonegawa的三分之一左右,但图灵指数显示,前者的影响力在进入21世纪后增长更快,2010年左右变得和后者一样,这意味着前者的贡献在近几年得到了认可,这一现象可以再次得到事实印证。OliverEWilliams虽然比SusumuTonegawa年长,但是他在2009年获得了诺贝尔奖,SUSUmUTonegaWa在1987年获得了诺贝尔奖,图灵指数因而能够发现这样的现象。同时,领域膨胀能够导致引用的快速增长,通过消除领域通胀的影响,图灵指数有助于发现真正的学术新星,在图9(q)和图9(r)中,菲尔兹奖获得者TerenCeTaO在通过图灵指数消除领域通胀影响后仍然增长迅速,这表明其影响力增长速度远远快于领域的通胀。综上所述,尽管在引用量、领域、年代等方面存在差异,但这些顶尖学者对其所属领域的影响是相似的。从学者的发展历程来看,由于现有理论并不能准确地刻画真实情况下的学术网络,学者的生涯并不能无限延长,论文发表亦不能无限增长。图灵指数下的学术网络始终符合暴律分布,由于资深学者影响力较高,“富者愈富”现象会在较短的时间周期出现,与理论贴合。但随着网络演进,经典的论文会保有其影响力,学者会更倾向于引用新近前沿的论文,图灵指数更高的学者在若干年后并不能因为过去图灵指数高而扩大优势,而是与当前的论文发表和学者工作的影响力息息相关,在过去图灵指数较低的学者,经过若干年的发展之后,有可能跟上甚至超越过去图灵指数更局的学者。6结束语图灵指数可发现引用量增长的本质,不仅有助于确定和比较不同领域不同年代学者的历史影响,而且可为领域排名和科学奖项提供可靠的评价指标。从应用角度来看,由于学者影响评价的准确性与数据的可靠性密切相关,图灵指数未来的研究工作将侧重于提高学者数据的准确性和泛化性,同时尝试用图灵指数对学者生涯轨迹进行刻画。从理论化角度来看,由于学者的引用量和学者关系可以通过社交网络中的理论来刻画,因此可以试图采用网络演进理论对图灵指数的评估标准进行微观解释,并将图灵指数应用到更广泛的领域影响力评估中。学者是人类科学知识的重要传承者、传播者和创造者,也是科技进步的主要推动者。某学科领域的高学术影响力学者在其研究领域中起着导向作用,是推动科学研究不断发展的中坚力量,他们的学术产出信息能够反映该领域的主要研究热点和发展趋势。科技文献是科研人员学术产出的主要形式,集中体现了科研人员的研究进程和创新成果,学者公开发表的文献被学术界或同行重视、认可和引用的情况,在一定程度上反映了学者的学术水平和影响力。在全球学术交流日益多元化的背景下,科学研究不再局限于科学家本人或有限的团队范围内,一个大范围行业内、跨行业乃至跨国界的学术交流与合作环境已经形成。在这个大环境中,无论是学术会议、学者互访、同行评议、交叉学科研究项目的开展,还是各学科专业领域研究人员继续进修与深造,都迫切需要了解本研究领域及其相关领域高学术影响力专家学者的学术产出信息及其科研合作网络和关联关系,从而更加快速、高效地掌握学科领域研究现状和前沿动态,使科研人员能够站在前人已有知识的基础上进行更高层次的发现与创造,促进更为广泛的学术交流。同时,也在合作交流中不断挖掘未用文字表达出来的隐性知识,为科研合作提供更加有效的支持。因此,学者的学术影响力的评价研究,一直以来都是科研管理和科研学术评价领域的研究热点,同时也是每一位学者的关注热点。对学者进行科学公正的评价,不仅可以激励学者不断创新,而且可以引导和鼓励学者不断调整和校准其研究方向,从事更加有价值的科研活动。1学者的学术影响力评价方法的研究现状主观评价法主观评价法是基于专家的知识和经验进行评价的方法,最具代表性的是同行评议。同行评议是由从事某领域及其相关领域研究的专家按照一定的标准和程序对该领域的科学研究活动及其相关要素(如研究人员、研究项目或研究成果等)进行评价的一种方法。同行评议方法的主要特点是主观性较强,参与评价的专家的知识和经验对评价结果影响重大,因此选择参与评价的专家至关重要。目前.,同行评议等主观评价法是对学者的学术影响力进行评价的主要方法之一。如华南师范大学焦建利教授在进行美国教育技术学领域最具影响力的10名领军人物的遴选上,运用同行评议方法向国内外教育技术领域的专家发放网络调查问卷,请专家对初步选定的具有一定影响力的30位候选人进行影响力大小的5个等级的评定,在同行专家评定结果的基础上对每位候选人综合得分进行排名,最终确定了美国教育技术领域10位具有重要影响的学者。因为专家同行能够更加真切地了解一篇学术论文的价值和影响力,所以同行评议方法在学术评价中的地位是任何定量评价方法所不能取代的。但是,利用同行评议方法对学者学术影响力进行评价也存在着一定的局限性,如专家同行的选定缺乏一个统一和公认的标准、成本较高、时效性较差等,在一定程度上较大地影响着评价的实际效果。1.2 文献计量法文献计量法即文献统计分析法,是将包含情报的相关文献的外部特征进行量化处理并利用统计学方法进行统计分析,通过数据揭示文献的特征和变化规律,从而达到情报分析和研究的目的。洛特卡通过对作者发文数量进行分析,提出了文献著者分布规律,并指出通过对发文量进行统计分析可以揭示科研人员的生产能力,并对其在科技发展和社会进步中的贡献进行评估。普赖斯在此基础上进一步分析,提出普赖斯定律,并推导出杰出科学家人数与全体科学家人数之比约等于0.812nmaxl20洛特卡定律及普赖斯定律的问世为研究人员利用文献计量指标进行学术评价打开了科学的大门,但是只利用发文量指标对学者学术影响力进行评价还不能反映学者所发表论文的质量。一篇文献在撰写过程中,一般都会参考其它相关文献,这样就形成了文献之间的引用与被引用关系。对引用情况进行分析,能够显示文献、学者、期刊等在科学发展过程中起的作用。20世纪50年代,美国情报学家GarfieId创建了科学引文索引(SCI),20世纪90年代,Webofscience引文数据库的建立,使引文分析法开始被科研人员广泛关注,总被引频次、篇均被引频次、影响因子等传统文献计量指标在学术评价中也逐渐得到科研人员和科研管理人员的认可和使用。2005年,JorgeEHirsch在传统文献计量指标的基础上提出了一个评价学者个人成就的指标h指数,就是其本人至多有h篇论文分别被引用了至少h次的评价指标。该指标可以更为有效地对学者长期累积的研究成果的影响力进行评价,但是该指标在学术评价上也存在着一定的局限性,如缺乏灵敏度(h指数越大,越难增长),对于发文数量少而被引频次高的学者的评价结果缺乏科学性等。随后,为了克服h指数的缺点,2006年,Egghe提出了h指数的改进指数g指数,它是一种基于学者累积贡献的评价指标,对于发文数量少而被引频次较高的学者的评价结果更加公平。除g指数外,一些其他的用于优化h指数的扩展指标也被提出,如e指数、AR指数、f指数、X指数、W指数、V指数等,用于弥补或完善上述文献计量指标的不足。2011年,Kosmulski提出“成功论文”的概念,即如果一篇文章的被引用频次大于其参考文献数量,就说明该文章是一篇“成功论文Kosmulski还进一步提出可以用成功论文数(thenumberofsuccessfulpapers,NSP)指标评价学者的学术水平。2012年,MatSaS教授提出了一个用于评价学者在学术界地位的指标,标准化的影响因子(nomalizedimpactfactor,NlF),学者的NIF的值可以简化为计算学者所有论文的被引频次之和与所有论文的参考文献数之和的比值。MatSaS称NIF值大于1的学者可以定义为学术界的领导者。该指标可以有效降低学者自引的影响,但同时一些学者可能刻意减少参考文献数量而影响评价结果。此外,随着网络的飞速发展,许多科研交流平台应运而生,再加上期刊开放获取的大规模开展,科学交流日益呈现网络化的特点,科研人员可以通过博客、微博、ReSearChGate等平台发布自己的学术论文,读者阅读、评论和下载学者的文献情况也一定程度上反映了该学者的学术影响力的大小,从而催生了替代计量学的兴起。王睿等人将Altmetrics指标与引文数指标进行对比分析,发现Altmetrics指标和引文数指标反映着读者对文献的不同关注方向,而且高Altmetrics指标的论文同时具有较高的学术影响力。在利用文献计量指标进行学术评价时,研究人员也会根据不同的评价目的、不同的评价主体以及不同的评价对象,选择不同的指标进行评价。如钟文娟在对图书馆建设的核心作者进行测评时,首先根据普赖斯定律确定核心作者候选人的最低发文量和最低被引量,选定在该刊发表4篇以上论文总被引频次在15次以上的作者为核心作者候选人,然后通过对核心作者候选人的发文指数和发文被引指数进行结合分析,把综合学术水平值大于100以上的作者确定为该期刊的核心作者;武汉大学邱均平教授利用发文量和h指数两个指标对图书情报领域高影响力的学者进行筛选,经过统计分析,认为该领域的高影响力作者至少需要在南大版20种图情核心期刊上以第一作者身份发文5篇以上,而且其h指数不少于5,从而确定了图书情报领域高学术影响力学者187人,结果显示核心期刊高发文量与h指数相结合的方法在评选高学术影响力作者方面的优势明显。显然,任何一个文献计量指标都不足以决定学者的命运,而且文献计量方法受出版周期的影响,无法及时反映学者的成果及其影响力。此外,在对学者所发文献的被引用情况进行分析统计时无法排除具有负面引用动机的文献。但是,文献计量方法凭借着指标丰富、统计简便的优势在科研机构产出评价、学科评价、科研人员评价等方面都得了到较为广泛的应用。1.3 社会网络分析法社会网络分析方法是基于的重要假设是节点的重要性等价于该节点与其他节点的连接而使其具有的显著性,通过计算节点的度、最短路径、节点和边上的权值的数据,发现网络中具有重要影响力的节点,通过对这些基本属性的统计和计算,相对定量地反映出节点在网络中位置的重要程度,进而评价学者在网络中的重要性。2009年印第安纳大学ErjiaYan等对图书情报领域的16本期刊近20年发文的合著作者情况进行统计分析,研究发现社会网络中的点度中心度、中介中心度和接近中心度与被引频次等评价指标具有显著的正相关性,表明中心性指标也可以用于评价学者的学术影响力。近年来,社会网络分析方法与引文分析方法相结合,分析学科结构和知识流动,成为学术评价的重要方法之一。2015年,孟祥保在对初步选取的被引次数50次以上和发文量5篇以上的62位国际图书情报学领域核心作者的互引网络分析中,指出度数中心性较高的是图书情报学领域的领军与核心人物,中间中心性和接近中心值较高的在专业领域具有广泛影响力。吴海萍在对国外多维临近与创新学术群体的分析中,对被引频次高于25以上的高频被引作者进行了社会网络分析,指出位于图谱中心的作者与更多的作者之间存在共被引关系,处于该学术领域的核心地位,具有较高的学术影响力。社会网络分析法可以可视化地揭示学者之间的学术关系,并能直观地展示学者在科研合作网络和论文引用网络中所处的学术地位。但是该方法只是对整体网络进行分析,在对学者进行学术评价时还应考虑具体的个体研究评价结果。此外,社会网络分析法动态性较弱,在未来的发展中还需要重点研究如何动态地展示学者的学术地位。I4综合评价法综合评价法主要是针对单项评价法而言,针对评价对象的多个方面的属性,利用多种指标对其进行评价。在利用该方法进行评价时,指标体系的建立以及各指标权重值的确定是最关键的步骤。如金晶等在对诺贝尔生理学或医学奖获奖者发表论文的学术影响力评价研究中,选取了单篇论文总他引量、单篇论文年均他引量、刊物当年影响因子等指标构建了一套适合自然科学中不同学科领域的论文影响力评价指标体系,并利用t。PSiS法计算综合评价值,该指标体系在对跨学科的科研论文进行评价时能够更加科学地显示论文的影响力。首都医科大学马路教授在对教育部学位中心排名前10所高校的临床医学科研产出情况进行评价时,选取了发文量、篇均被引频次、平均百分位、热点论文百分比、FlOOO推荐论文数等10个评价指标,采用专家咨询法进行各评价指标的权重值的确定,并通过检验验证了该研究的排名与教育部公布的排名具有统计学意义上的相关性。该研究虽然是针对临床医学学科的评价研究,但其运用多项文献计量指标构建科研产出评价指标体系的方法对于学者学术影响力的评价具有重要的借鉴意义。综合评价法不仅可以把定性指标与定量指标相结合,而且还可以按照不同属性把指标分为不同类别,并在每一类下分解出子指标,形成若干细分层次的指标体系。虽然随之也带来计算相对复杂的难题,但是当面对复杂评价对象或评价问题时,综合评价法则成为研究人员或决策者的重要选择之一。2学者的学术影响力评价方法的发展趋势2.1 定性评价方法与定量评价方法相结合得到更多认可单纯的定性评价和定量评价都存在一定的缺陷,例如定性评价主观性较强,评价效率低;定量评价时滞过长,影响力较片面等。目前,在学者的学术影响力评价上,定性评价和定量评价相结合的方法以其更加科学的评价结果得到更多评价主体的认同和应用。为了更好地发挥两种方法的优势,克服两种方法的缺陷,国外学者NiCOIe将发文量、被引次数、前1%论文数等定量评价指标与同行评议方法结合对法国600个研究团队进行了评价,证明了定性评价与定量评价方法相结合进行评价具有一定的可行性而且评价结果的科学性更高。此外,还出现了一些定量和定性相结合的评价系统和指标,例如在生物医学领域,学者的FlOOO推荐论文数已被公认为反映其科研学术水平的重要指标,因为FlOOO是在全球近6OOO名生物学和医学领域的顶尖科学家以及另外的5(M)O名优秀科研人员对论文定性评价的基础上,再给予定量的星级评价,FIoOO推荐的每篇论文都有一篇推荐评论和一个星级分数,FlOOOPnme得分也成为生物医学领域论文科学影响力评价的重要指标。2.2 针对学者评价的文献计量指标研究日益深入随着学者对文献计量学更加深入的研究,部分文献计量指标的缺点逐渐暴露。2005年赫希提出用于评价科学家个人成就的指标h指数之后,针对h指数的缺陷,科研人员又提出了许多改善h指数的扩展指标,如g指数、e指数、A指数、X指数等。李海英等人又在X指数的基础上,考虑作者的署名位次和文章作者数量等因素提出了一个新的改进的评价指标即V指标,但是至今仍然没有出现一个公认的指标可以进行全面科学的评价。后续的文献计量学家们还需要不断地开发新的指数,以最大限度地克服现有文献计量指标的局限性。这些新的指标的不断改进和优化有利于更加科学、合理地评价各领域的每一位学者的影响力。2001年汤姆森科技集团推出了一款文献分析工具ESI(基本科学指标数据库),并在随后的科研评价中得到了广泛的应用。2011年该公司又推出了一款InCiteS数据库,基于WebOfSCienCe核心合集的数据,借助文献计量指标和各学科国际标杆数据,对学科、期刊、科研机构、科研人员进行评价,并可以可视化地呈现评价指标的统计和分析结果。近年来,借助ESl和InCiteS数据库进行文献计量指标统计进而评价学者的学术影响力的研究逐渐受到情报学和科学管理学学者的重视。例如闫素兰等人借鉴ESl数据库中确定高影响力学者的方法,将被引频次排在前1%的作者选定为高影响力的作者并对这些作者的文献信息进行了分析;杨芳等人选取InCites数据库中的总论文数、被引频次、平均百分位、学科相对影响力等指标对两位不同学科领域的带头人的学术影响力进行了比较研究,并指出该平台能够快速地得出文献计量学指标的统计分析结果,是科研人员评估的一个良好工具。随着越来越多的学者逐渐重视并借助上述工具进行评价,科研评价效率将大大提高。2.3 社会网络分析指标得到普遍关注随着科研合作日益广泛,学者学