分类:国家-学科的投入产出分析
背景
在这个项目里面,通过对以国家[math]\displaystyle{ \times }[/math]学科为单位的投入产出矩阵的分析,我们来回答某个国家的某个领域对另外一个国家的另外一个领域的影响的问题,并且也能够讨论其某种意义上合起来的影响力。我们所用的方法就是广义投入产出分析[1]。
数据已经具备,方法也已经成形。但是在具体问题上的结果提炼意义挖掘,都需要一定的具体问题背景。
除了国家[math]\displaystyle{ \times }[/math]学科,我们还可以讨论城市[math]\displaystyle{ \times }[/math]学科、学校[math]\displaystyle{ \times }[/math]学科等。
同时,期刊、作者、论文层次的相互影响和相对地位的分析,也是可以开展的研究。
分析方法
除了在单层网络上,也可以在多层网络上开展。也就是讨论作者、论文、主题的重要性的时候,用相互影响来讨论:一个重要主题上的工作,就算引用不多,也是重要的,以及过来,一个引用很多的文章或者一个大牛科学家工作的主题,也是一个重要的主题。
除了封闭系统的投入产出分析(本征值和本征向量),我们还可以考虑开放系统的投入产出分析(矩阵逆),目标外界投入产出分析(把封闭系统中的某个部门拿出来放到右边,看作外界,构成开放系统,用开放系统的分析方法。相当于考考虑中国某学科对美国某学科的引用增加了一次这件事情从来源上和去处上的间接效果)。其实,在没有外界的时候(可能信息不够,例如专利引用论文的数据没有),也可以像PageRank一样,直接把外界当作全同矢量[math]\displaystyle{ \left[1,1,\cdots,1\right]^{T} }[/math]。
用开放系统投入产出分析处理部分引用网络数据问题
有的时候,所需要排序的论文仅仅是整个数据库里面的一部分。原则上说,这样的数据不完整可能对结果是有很大的影响的,尤其是,如果我们仅仅考虑通过在这个子集之内的论文的引用网络来得到论文的影响力指标的话。那么,在所有论文的引用网络数据不能(不容易或者没必要)获得的情况下,有没有一个合理的方法来对基于这个子集的引用网络数据来处理这个问题呢?
有,开放系统的投入产出分析。把这个子集内的论文的被引情况分成两类:被集合内文章的引用、被集合外文章的引用。对于集合内引用,获取完整的引用网络数据[math]\displaystyle{ x^{i}_{j} }[/math]。对于集合外文章的引用,只需要获得被引次数。被引次数可以直接通过这些文章的总被引次数减去集合内被引次数来得到,记为[math]\displaystyle{ x^{i}_{e}=e^{i} }[/math]。这时候,[math]\displaystyle{ x^{i}_{j} }[/math]就是投入产出系统的内部,[math]\displaystyle{ x^{i}_{e}=e^{i} }[/math]就是这个投入产出系统的外界。
可能的检验
在文章的层面可以考虑用F1000人工论文影响力(f1000网站)评价数据来
参考文献
- ↑ Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu, Interrelations among scientific fields and their relative influences revealed by an input–output analysis, Journal of Informetrics 10, 82-97(2016). Doi:10.1016/j.joi.2015.11.002.
本分类目前不含有任何页面或媒体文件。