运用广义投入产出分析结合集合内引用关系和集合外被引次数

来自Big Physics
跳转至: 导航搜索


研究背景和问题

PageRank、投入产出分析,以及我们发展和统一的投入产出分析,可以用于从引用关系网络计算文章、作者、期刊、地区、领域、基金组织等的影响力和这些主体之间的相互影响[1] [2][3] [4][5]。当然,是否这样的直接和间接综合影响的计算能够给出来比直接数被引次数更好的指标,还是一个问题[6]。尤其是考虑到这样的计算往往不是全库数据,而是在某个较小规模的论文集合上做计算。当然,这些问题还需要进一步研究。

但是,同时,这里有另一个有意思的问题:是不是在只有小集合的数据的时候,能够用上包含这个小集合的更大集合的某些数据,来提高小集合上所做的计算的准确性?例如,当我们用APS数据做广义投入产出计算的时候,是不是能够把来自于WoS的对APS文章的引用次数用上?

当然,如果能够完整地获取WoS的引文网络,则就直接在大集合上计算就行了。关键就在于,可能大集合的引文网络难以获得,但是,被引次数却比较容易获得。这个时候,在小集合的引用网络的基础上,是不是加上来自于大集合被引次数,能够使得算出来的结果更加合理?当然,所谓合理可以和真的在大集合引文网络上算出来的结果比较,也可以和某种金标准(获奖人、获奖论文之类的)或者直觉相比较。

再具体计算上,实际上,就是考虑开放系统的投入产出、Personalized PageRank等。

研究思路和下一步工作

  1. 做文献调研,看一看这个问题和方法有没有前人的工作。
  2. 在APS论文引用网络数据上,利用WoS内的文章被引次数(减去引用网络内部的被引次数),传播出来看看广义投入产出带来的直接和间接综合影响的效果。效果的检验是个问题,实在不行就用获奖作品。或者把作者-论文-概念做出来当作获得作者排序、概念排序、国家份额计算的一种方式。

参考文献

  1. P.Chen H.Xie S.Maslov S.Rednera, Finding scientific gems with Google’s PageRank algorithm, Journal of Informetrics, 1(1), 8-15(2007). https://doi.org/10.1016/j.joi.2006.06.001
  2. Sergei Maslov and Sidney Redner, Promise and Pitfalls of Extending Google's PageRank Algorithm to Citation Networks, Journal of Neuroscience28 (44) 11103-11105(2008); DOI: https://doi.org/10.1523/JNEUROSCI.0002-08.2008
  3. Bergstrom C (2007) Eigenfactor: measuring the value and prestige of scholarly journals. C&RL 68:314-316.
  4. Brin S, Page L (1998) The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems 30:107-117.
  5. Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu, Interrelations among scientific fields and their relative influences revealed by an input–output analysis, Journal of Informetrics 10, 82-97(2016). Doi:10.1016/j.joi.2015.11.002.
  6. Dalibor Fiala, Gabriel Tutoky, PageRank-based prediction of award-winning researchers and the impact of citations, Journal of Informetrics,11(4),1044-1068(2017), https://doi.org/10.1016/j.joi.2017.09.008