分类:考虑教材和专利的论文影响力衡量

来自Big Physics


研究背景和问题

论文影响力除了可以在论文引用论文的系统内部来衡量(注意这个衡量实际上就需要综合考虑直接和间接影响)之外,还可以从外部来考虑:从转化成专利的角度老考虑论文对技术的贡献,从被收集到教材的角度来考虑论文对人类文明积淀的贡献。

对于第一个问题,我们需要收集专利对论文的引用,甚至产品对专利和产品对论文的引用。

对于第二个问题,我们需要收集教材(以及更一般的书籍)对论文的引用,或者教材中的概念第一次来自于哪篇文章。

有了数据之后,就可以用开放系统的投入产出分析方法来做相应的分析。

实际上,同样的思想也可以用到引用网络的内部:如果我们仅仅知道一部分引用网络的数据,但是还有其他网络外的文章对这部分引用网络内的文章的引用次数,那么,我们就可以把这个引用网络外的数据当作外界,传到内部去。

研究思路和下一步工作

  1. 沟通专利到论文,论文到专利,专利到专利,论文到论文的引用。
  2. 沟通书籍到论文,论文到书籍,书籍到书籍的引用。
  3. 沟通书籍到专利,专利到书籍的引用。
  4. 分别通过这七个矩阵得到论文、专利、书籍的影响力指标。
  5. 把这七个矩阵或者其中的若干个矩阵合起来做投入产出分析等间接指标的计算,对比这些不同方式定义的指标,以及和实证数据对比。
  6. 找一个某专业,例如物理或者生物,的专业词汇表。
  7. 用google book data(google book ngram)来获取词汇表的词频数据。
  8. 通过对研究论文做全文搜索来找到词汇第一次提出的论文,并且建立词汇到论文的投入产出关系。
  9. 对这个网络做投入产出分析,或者结合这两个网络再来做投入产出分析
  10. 比较纯论文引用的,包含专利的,包含书籍和词汇的,影响力度量的结果
  11. 在APS论文引用网络数据上,利用WoS内的文章被引次数(减去引用网络内部的被引次数),传播出来看看广义投入产出带来的直接和间接综合影响的效果[1] [2][3] [4]。效果的检验是个问题,实在不行就用获奖作品。或者把作者-论文-概念做出来当作获得作者排序、概念排序、国家份额计算的一种方式。

一个相关但是不同的研究

我们可以从书籍、Wikipedia或者手动制作的学科概念的地图加上来自于论文的概念使用频率数据,来研究学习顺序、个性化学习顺序、搞笑检测算法。见物理学概念网络和学习

数据来源

  1. 论文引用论文数据可以有WoS、Dimensions等资源。还可以考虑Scihub-Libgen资源
  2. 书籍引用论文数据,WoS的Book Citation Index有。还可以考虑Scihub-Libgen资源
  3. 论文引用书籍数据,待查。
  4. 专利引用专利数据,可以考虑Derwent等专利数据库。
  5. 论文引用专利数据,待查。
  6. 专利引用论文数据,待查。Dimensions有部分资源。
  7. 专利引用书籍数据,暂时可以忽略。
  8. 书籍引用专利数据,可以考虑Scihub-Libgen资源

可以考虑在只有部分资源的情况下,也做一个展示性的研究。

参考文献

  1. P.Chen H.Xie S.Maslov S.Rednera, Finding scientific gems with Google’s PageRank algorithm, Journal of Informetrics, 1(1), 8-15(2007). https://doi.org/10.1016/j.joi.2006.06.001
  2. Sergei Maslov and Sidney Redner, Promise and Pitfalls of Extending Google's PageRank Algorithm to Citation Networks, Journal of Neuroscience28 (44) 11103-11105(2008); DOI: https://doi.org/10.1523/JNEUROSCI.0002-08.2008
  3. Bergstrom C (2007) Eigenfactor: measuring the value and prestige of scholarly journals. C&RL 68:314-316.
  4. Brin S, Page L (1998) The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems 30:107-117.

本分类目前不含有任何页面或媒体文件。