分类:基金随机资助策略的研究

来自Big Physics
Jinshanw讨论 | 贡献2019年12月18日 (三) 21:56的版本


问题背景

在基金申请书评价、科学论文稿件评价、招生评价、招工评价等问题中,对于比较随大流的申请书、论文、学生和员工,一般来说,评价者给出的评价会相对来说比较准确(可以通过现有数据验证一下,看看方差之类的。或者把已经得到或者没有得到的项目,送出去再一次评审一下,看看稳定性)。但是,对于比较有个性(创新性比较高、和很多其他个体不太一样)的个体,评价者给出的评价往往会不太准确。这个不太准确可能表现为各个评价者给出的评分相差比较大(方差大),可能表现为有个性的个体的评价均值偏低(例如,论文挑战了比较有共性的认知)。可是,科学的进步往往很需要这些非同寻常的个体的贡献,不管是创新性高的研究项目、论文,还是特立独行的学生和员工。一个真正具有非凡创造性的个体发挥的作用远远大于一大群随大流的个体。

那么,有没有办法设计一个评审机制或者说资助策略能够把这样的个体更多地保留下来?

其他研究者也已经注意到这个问题,甚至建议采用随机资助[1] [2] 。在新西兰的科研项目中,甚至做了实现(是否能够找到关于这个实验的数据?)。

研究方法和内容

在这里,我们提出来一个可能的资助策略:直接资助非常少量的最优秀项目(记为Top[math]\displaystyle{ T\% }[/math],或者说集合[math]\displaystyle{ T }[/math])、直接剔除一定数量的最差项目(记为Down[math]\displaystyle{ D\% }[/math],或者说集合[math]\displaystyle{ D }[/math]),对剩下的项目实行随机分配(记为Random[math]\displaystyle{ R\% }[/math],或者说集合[math]\displaystyle{ R }[/math])。

我们想看看是否能够做一些研究来在做试验检验之前,从理论上检验一下这个资助策略。

除了不同策略的实验研究(虚拟再次评审)、已经尝试的不同资助策略的实证数据分析(统计方差、新西兰等的实证分析),我们还可以做建模分析。(在这里补充调研,例如其中一个模型在这里[3][4]

模型设计

基本假设:

  1. 评价者对创新性比较高的被评价对象的评分偏低(均值小)。
  2. 评价者对创新性比较高的被评价对象的准确率偏低(方差大)。
  3. 不考虑创新性的条件下,评价者对最优秀和最差的被评价对象的识别准确率比较高(方差小),中间层次的准确率比较低(方差大)。
  4. 忽略每个项目的预算差别,项目受资助的比例[math]\displaystyle{ r }[/math]是一个确定值。
  5. 忽略每一个评价者的评价能力的差别。
  6. 每一个评价者对一个特定项目做出来的评价分数是一个高斯分布(或者其他特定的分布函数)。


变量选择:

  1. 每一个被评价对象有两个自由度的质量度量:创新性[math]\displaystyle{ c }[/math]、创新性之外的质量度量[math]\displaystyle{ q }[/math]。为了更加简化,可以取[math]\displaystyle{ q,c=1,2,3,4,5 }[/math]。还需要决定所有被评价者的[math]\displaystyle{ q,c }[/math]取自于什么分布。这个可能会影响结论。
  2. 每一个被评价对象的真实质量满足增函数[math]\displaystyle{ H=H\left(q,c\right) }[/math],例如[math]\displaystyle{ H=qc }[/math]或者[math]\displaystyle{ H=q+c }[/math]
  3. 每一个被评价对象的观测质量[math]\displaystyle{ Q=Q\left(q,c\right) }[/math][math]\displaystyle{ q }[/math]的增函数,[math]\displaystyle{ c }[/math]的减函数,例如[math]\displaystyle{ Q=\frac{q}{c} }[/math]或者[math]\displaystyle{ Q=max\left(q-c,0\right) }[/math]
  4. 观测(评价者评价)机制:评价者得到的评价数值是一个由被评价对象的质量[math]\displaystyle{ \left(c,q\right) }[/math]决定的概率分布函数,例如,[math]\displaystyle{ \rho\left(O\right)=\frac{1}{Z}e^{-\frac{\left(O-Q\right)^{2}}{2\sigma^{2}\left(q,c\right)}} }[/math],其中[math]\displaystyle{ \sigma^{2}\left(q,c\right)=\left(\frac{1}{q-q_m+d}\right)^{2}+c^{2} }[/math],或者更进一步把大[math]\displaystyle{ q }[/math]和小[math]\displaystyle{ q }[/math]的方差区分开。


目标:在固定支持比例下,选择合适的资助项目集合[math]\displaystyle{ S }[/math],使得这个集合的真实质量最大,[math]\displaystyle{ H_{S}=\sum_{s\in S} H_{s} }[/math]

资助策略:对于每一个被评价者,只有评价者给出的分数是可观测量,我们的资助策略必须只能按照这个客观测量来制定。对于给定的被评价者,计算所有评价者给出来的对这个评价者的评价分数的均值,还记为[math]\displaystyle{ O }[/math]。考虑以下几种资助策略,

  1. 传统Traditional:按照顺序从最优的开始资助,直到达到受资助比例[math]\displaystyle{ r }[/math],也就是[math]\displaystyle{ \left\{O\gt O_{r}\right\} }[/math]
  2. 随机Fully Random:所有项目完全随机。
  3. 中高端随机HM-Random:去掉一些评分最差的项目(例如,[math]\displaystyle{ \left\{O \lt O_{L}\right\} }[/math]),然后对剩下的随机。
  4. 中低端随机ML-Random:支持一些评分最高的优秀项目(例如,[math]\displaystyle{ \left\{O\gt O_{H}\right\} }[/math]),然后对剩下的随机。
  5. 中端随机M-Random:去掉一些评分最差的项目,支持一些评分最高的优秀项目,然后对剩下的随机。
  6. 更加复杂的,除了关注简单算术均值之外的其他排序方法的计算(见并行排序以及比较两个集合的方法),暂时不纳入本项目考量。
  7. 更加不靠谱的问题:是否可以试试用机器学习优化,得到一个从输入变量[math]\displaystyle{ \left\{O_{j}\right\}, r }[/math]得到输出变量[math]\displaystyle{ S }[/math],并能够得到[math]\displaystyle{ H_{S} }[/math]的极大值的一个“资助决策机”,还能从里面看出来点大概如何选择的策略?

以上各种函数形式都可以改,只要保持增减的趋势不变。

不过,具体函数的形式,而不仅仅是增减性,甚至还有所有被评价者的[math]\displaystyle{ q,c }[/math]取自于什么分布都会影响最终的定性结论。因此,结论的鲁棒性是一个要研究的很大的问题。

研究方法上,除了做模拟,是否还可以依靠上面的导数(增减性)假设,直接得到一个哪一种策略更好的结论呢?或者说,先做模拟,得到一些定性结果,然后想办法证明这些定性结果。

参考文献

  1. Shahar Avin, Policy Considerations for Random Allocation of Research Funds, DOI: https://doi.org/10.13130/2282-5398/8626 .
  2. Dorothy Bishop, Luck of the draw, https://www.natureindex.com/news-blog/luck-of-the-draw .
  3. Shahar Avin, Centralized Funding and Epistemic Exploration, The British Journal for the Philosophy of Science, Volume 70, Issue 3, September 2019, Pages 629-656, https://doi.org/10.1093/bjps/axx059 .
  4. Elise S Brezis, Focal randomisation: An optimal mechanism for the evaluation of R&D projects, Science and Public Policy, Volume 34, Issue 10, December 2007, Pages 691–698, https://doi.org/10.3152/030234207X265394 .

子分类

本分类只有以下子分类。