分类:基金机构影响力度量

来自Big Physics
Jinshanw讨论 | 贡献2017年6月23日 (五) 20:30的版本


以下的几个项目和基金机构的影响力和角色有关系,放在一起。具体研究方法上实际上依赖的是其他项目中发展起来的方法,尤其是间接联系和科学学多层网络的思想和方法。当然,随着研究的深入,也有可能可以提出我们目前的思想能够解决但是具体方法和框架不能解决的问题,这样还能反过来促进方法和框架的发展。

从我们科学学的两大核心理念——多层网络和投入产出分析——的角度来说,基金机构的角色就在于下面的这个关系网络:科学工作(论文、科学家、研究领域)促进科学技术(专利、产品)的发展,科学技术变成产品提高生活质量并在经济生产和消费中产生经济价值,经济系统把前投入到基金机构,基金机构把钱投入到科学工作。当然,实际上,有可能会跳过其中的一些步骤,例如企业可以直接投入钱到基础研究或者技术开发中去。先不管这个跳步骤的事情。

那么,在这样一个关系网络中,哪些数据是现在比较容易获得并且可靠的呢?科学研究内部(论文引用、科学家写了哪些论文、论文的研究主题是什么)这个相对可靠。科学和技术的关系大概可以通过从专利文献识别研究论文,从研究论文识别专利找出来。科学技术转变成产品并且进入经济流通一定程度上可以通过专利授权和专利转化来计量不过目前没有集中的数据。经济到基金机构的投入应该很明确。经济通过企业研发进入到科学的,可能不是非常容易获得。基金机构到科学研究应该数据也可靠并且集中。例如NIH已经提供打包下载,NSFC也可以通过检索界面获得。

这样一个数据整理起来就是这样一张投入产出表:

基金机构[math]\displaystyle{ f }[/math]  研究项目[math]\displaystyle{ pr }[/math] 研究者[math]\displaystyle{ r }[/math] 论文[math]\displaystyle{ pu }[/math] 专利[math]\displaystyle{ pa }[/math] 产品[math]\displaystyle{ prod }[/math] 生产和消费者[math]\displaystyle{ mc }[/math]
基金机构[math]\displaystyle{ f }[/math]  [math]\displaystyle{ X^{f}_{f} }[/math] [math]\displaystyle{ X^{f}_{pr} }[/math] [math]\displaystyle{ X^{f}_{r} }[/math] [math]\displaystyle{ X^{f}_{pu} }[/math] [math]\displaystyle{ X^{f}_{pa} }[/math] [math]\displaystyle{ X^{f}_{prod} }[/math] [math]\displaystyle{ X^{f}_{mc} }[/math]
研究项目[math]\displaystyle{ pr }[/math]  [math]\displaystyle{ X^{pr}_{f} }[/math] [math]\displaystyle{ X^{pr}_{pr} }[/math] [math]\displaystyle{ X^{pr}_{r} }[/math] [math]\displaystyle{ X^{pr}_{pu} }[/math] [math]\displaystyle{ X^{pr}_{pa} }[/math] [math]\displaystyle{ X^{pr}_{prod} }[/math] [math]\displaystyle{ X^{pr}_{mc} }[/math]
...  ... ... ... ... ... ... ...

当然,其中的某些可以在实际研究中去掉,例如研究者可以放到研究项目里面去,甚至研究项目和论文也可以合并。其中有一些元素应该是零,例如从基金机构到生产消费者,基金机构本身的购买消费对经济和科学技术的影响可以忽略不计。还比如从科学研究项目到基金机构的贡献也可以大概忽略(当然,也存在基金机构由于支持了某个研究特别出色然后获得了更多的可以分配的经费的情况,这个时候,就不是零了)。还有,其中应该有一个单独的政府部门,不过,在这里可以认为已经把基金单位的作用和政府合并。更重要的,实际上,这里的每一个主体都可以分的更细,例如[math]\displaystyle{ f }[/math]可以分成不同的国家基金机构。如果愿意,还可以在上面的表格里面加上“科学概念”和“技术代码”。前者表示论文工作的主题和学科领域,后者表示专利所在的技术部门。

下面,我们问,理论上,有了这个投入产出表,我们能够做什么,以及按照目前能够获得的数据,能够做什么?注意,有了这个表格,就表示我们的分析方法和思路主要就是多层网络和广义投入产出。当然,如果某些问题的分析需要其他的分析方法,也是可以的。


基金机构在科学和技术上的影响力的度量

首先,可以看一看对于科学发展——具体到论文的发表领域的发展——来说,基金机构的支持发挥了多大作用。最简单的方法,就是统计这个基金机构支持下的项目,在一段时间内(可以是基金支持期间、之前几年、之后几年)所发表的论文数量和被引次数。这就是直接统计的方法。如果考虑间接影响,则有以下不同的方式来运用分类:广义投入产出分析

例如,在文章的层次,可以把基金机构当做一个外生投入部门,先得到一个基金机构的投入向量(向量的每一个元素例如可以是——如果有支持就是1,没有就是零)。然后研究这个外生投入向量在整个文章通过引用关系构成的投入产出网路上的传播。投入产出网络如何构建,传播如何计算,可以参考分类:广义投入产出分析

例如,还可以在领域的层次,可以把基金机构当做一个外生投入部门,先得到一个基金机构的投入向量(向量的每一个元素例如可以是——如果有支持就是用所支持的项目经费,没有就是零)。然后研究这个外生投入向量在整个领域通过领域之间的引用关系构成的投入产出网路上的传播。投入产出网络如何构建,传播如何计算,可以参考分类:广义投入产出分析

我们还可以把基金机构当做一个内生部门,直接来分析上面的整个投入产出矩阵,算出来上面各个主体之间的综合(包含直接和间接以后的)相互关系,以及各个主体的重要性。具体计算参考分类:广义投入产出分析

在具体计算上,考虑到数据的可获得性,在合适(也是无奈)的地方,可以把上面的表格截断,例如把产品、生产和消费者暂时去掉,甚至把研究者和研究项目也去掉,主要依靠论文之间、论文专利之间的扩散机制来讨论基金机构的影响力。如果开展一下不同时期和不同国家之间的对比,还应该是一个有意思的又有可能有实际参考价值研究。甚至,在初始阶段,我们可以仅仅考虑论文之间的扩散机制来讨论基金机构的影响力,把专利那部分也去掉。也就是说,基金机构在科学和在技术上的影响力,一定程度上,可以分开来研究。当然,实际上是分不开的,仅仅是说,由于从科学到技术之间的联系应该来说比科学之间的联系要稀疏,因此,当仅仅考虑科学影响力的时候,大约可以先去掉专利那部分。我们提到暂时去掉产品和消费者等部门也是同样的理由。

热点追踪问题和基金机构行为或者政策之间的关联

分类:热点追踪研究中,我们发现科学家新发表的工作确实以更大的几率出现在目前已经发表了大量论文的领域中。这个几率和领域大小存在幂率关系。我们称这个幂率为热点追踪指数/程度。我们还发现,相比美国,中国的这个指数比较高,同时小领域的相对贡献率中国比较小,也就是主要集中在大领域里面。不是说大领域就不好,而是说这样的(相对于美国)太过集中地在大领域里面可能有一些政策上的原因。于是,我们想从不同的角度看一看这个有没有一些可能的原因。

其中一个可能的研究就是去看看,是不是,基金支持也存在类似的比较偏大领域的现象,而且是否相对于其他国家,也程度更高?还可以做一个这个程度的纵向对比,同时再把热点追踪程度的纵向发展趋势也画出来,看看是否有关联。

合作者还建议,是否可以考虑一下不同类型(例如不同地区,不同学科,不同性质的研究单位)的研究者,是否展现出来不同的热点追踪程度。没准也可以通过这个类型来了解更多的原因,同时对政策有一定的参考价值。

高质量工作中基金机构的作用

通过对热点追踪工作的研究,我们就能够注意到,中国所发表的文章大部分集中在大领域里面。于是,合作者就提出来这样一个问题:当考虑所有的中国学者发布的文章的时候,由于体量非常大,其中基金机构支持的比例有比较高,于是就显得基金机构的作用很大;是否可以考虑某种更加严格,于是也就相当于更有说服力的指标,例如考虑某种高质量论文?

简单来说,这个工作有非常直接的思路,甚至都不需要用多层网络和投入产出的思想和方法:定义某种重要性指标,然后看一看在这个指标线,中国论文有多少,其中基金机构支持的有多少。例如,取全球论文按照被引次数(可能要学科归一化)排名的[math]\displaystyle{ 1\% }[/math][math]\displaystyle{ 2\% }[/math][math]\displaystyle{ 5\% }[/math][math]\displaystyle{ 10\% }[/math][math]\displaystyle{ 20\% }[/math])来计算引用错误:没有找到与</ref>对应的<ref>标签 </references>

子分类

本分类有以下3个子分类,共有3个子分类。