分类:论文热点追踪

来自Big Physics


问题背景

对一个研究工作的创新性的度量是科学学的重要问题,而且是很难通过直接数被引次数来回答的问题。如果真的要回答,要去看一个研究工作在研究问题、研究方法、结论上是否是没有或者很少被前人提出来过。这样的研究需要科学学三层网络框架。不过,在那之前,我们也可以尝试建立一些和创新性非常有关联的其他的指标,例如,论文追热点领域引文追热点替代力指数,以及这里的论文追热点


论文追热点程度定义

定义引文网络[math]\displaystyle{ x=\left(x^{i}_{j}\right)_{N\times N} }[/math] (代表[math]\displaystyle{ j }[/math]引用[math]\displaystyle{ i }[/math]),则每篇论文的被引次数为[math]\displaystyle{ X^{i}=\sum_{j}x^{i}_{j} }[/math]。 按照“引用追热点程度高的论文其本身追热点程度也高”的思想(TrustRank中值得信任的网站所引用的网站也值得信任,引用不值得信任的网站的网站也不值得信任[1]),我们有 [math]\displaystyle{ h^{\left(1\right)}_{j} = \sum_{i}h^{\left(2\right)}_{i}F^{i}_{j} = \sum_{i}h^{\left(2\right)}_{i}\frac{x^{i}_{j}}{X_{j}}, \\ h^{\left(2\right)}_{i} = \left(1-\alpha\right) h^{\left(1\right)}_{i} + \alpha X^{i}. }[/math] 其中[math]\displaystyle{ F^{i}_{j} = \frac{x^{i}_{j}}{X_{j}} }[/math]

写成矩阵形式,就是[math]\displaystyle{ h^{\left(1\right)} = h^{\left(2\right)}F, \\ h^{\left(2\right)} = \left(1-\alpha\right) h^{\left(1\right)} + \alpha X^{a}. }[/math]也就是[math]\displaystyle{ h^{\left(1\right)} = \left(1-\alpha\right)h^{\left(1\right)}F + \alpha X^{a}F \Longrightarrow h^{\left(1\right)} = \alpha X^{a}F\left(1-\left(1-\alpha\right)F\right)^{-1} }[/math]。其中,[math]\displaystyle{ h^{\left(1\right)} }[/math] 为论文发表的时候的追热点程度,[math]\displaystyle{ h^{\left(2\right)} }[/math]为累积了引用之后论文的追热点程度。

初步结果

下一步工作

  1. 在物理APS数据、数学经济学数据、更多其他领域的数据、甚至全数据上做论文追热点程度计算
  2. 分析论文追热点程度和其他论文属性的相关性,例如分国家、作者数量、领域、参考文献数量、被引次数、是否国际合作等
  3. 解释计算结果

参考文献

  1. Zoltan Gyoengyi, Hector Garcia-Molina, Jan Pedersen, {\it{Combating Web Spam with TrustRank}}.

本分类目前不含有任何页面或媒体文件。