分类:科学家的半衰期
研究背景和问题
科学家有生命(生死)、学术生命(发文章和不发了,可以定义10年没见新文章就是不发了之类的)、学术影响力生命(论文从被引用到不再被引用)。那么,能不能计算一下这些生命周期的半衰期:生死的角度来说,也就是真的生命的一半是多少;对于学术生命,就是一半数量的文章是什么学术年龄的时候发的;对于学术影响力生命,就是一半数量的引用是在什么学术年龄的时候得到的。
前人研究过文章被引半衰期、期刊被引半衰期[1]、知识的半衰期[2][3]。现在看看科学家的半衰期。
除了生命期、学术生命期、论文数量半衰期、引用半衰期的分布函数[math]\displaystyle{ p_{y} }[/math],我们还可以研究这些年份的淘汰率。比如,对生命期来说,就是计算某一年龄结束生命的人,占所有生命大于等于这个年龄的人的数量[math]\displaystyle{ r_{y}=\frac{p_{y}}{\sum_{z\geq y}p_{z}} }[/math]。这相当于寿险行业中的分年龄死亡率。
同样,半衰期也可以做这样的计算。相当于算的是学术活动半活跃淘汰率,也就是对于这个学术年龄[math]\displaystyle{ y }[/math]的研究者来说,大约有[math]\displaystyle{ r_{y} }[/math]的概率进入学术活动后半期。
有了这个淘汰率(死亡率),就可以计算一个处于第[math]\displaystyle{ y }[/math]年的科学家,平均来看,还有[math]\displaystyle{ E_{y} }[/math]年才会从科学界退出、或者半退出(论文数量的角度、被引次数的角度),[math]\displaystyle{ E_{y}=\sum_{x=y+1}^{N}\left(x-y\right)\left[\Pi_{z=y}^{x-1}\left(1-r_{z}\right)\right]r_{x} }[/math]。其中[math]\displaystyle{ \left[\Pi_{z=y}^{x-1}\left(1-r_{z}\right)\right]r_{x} }[/math]表示从y年开始,这个科学家都没有退出,但是,到了第x年,退出了,的概率。
数据基础格式
人口数量时间序列
| 年龄0 | 年龄1 | 年龄2 | 年龄3 | 年龄4 | ...年龄N | |
|---|---|---|---|---|---|---|
| 年龄0 | [math]\displaystyle{ x^{1}_{1} }[/math] | [math]\displaystyle{ x^{1}_{2} }[/math] | [math]\displaystyle{ x^{1}_{c} }[/math] | [math]\displaystyle{ x^{1}_{e_{1}} }[/math](直接倾倒,暂取0) | [math]\displaystyle{ x^{1}_{e_{2}} }[/math] (直接倾倒,暂取0) | 0 |
| 年龄1 | [math]\displaystyle{ x^{2}_{1} }[/math] | [math]\displaystyle{ x^{2}_{2} }[/math] | [math]\displaystyle{ x^{2}_{c} }[/math] | [math]\displaystyle{ x^{2}_{e_{1}} }[/math] (直接倾倒,暂取0) | [math]\displaystyle{ x^{2}_{e_{2}} }[/math] (直接倾倒,暂取0) | 0 |
| 年龄2 | [math]\displaystyle{ x^{c}_{1} }[/math] | [math]\displaystyle{ x^{c}_{2} }[/math] | [math]\displaystyle{ x^{c}_{c} }[/math] (投入到劳动力再生产的劳动力,暂取0) | [math]\displaystyle{ x^{c}_{e_{1}} }[/math] (坐吃等死,忽略取0) | [math]\displaystyle{ x^{c}_{e_{2}} }[/math] (坐吃等死,忽略取0) | 0 |
| 年龄3 | [math]\displaystyle{ x^{e_{1}}_{1} }[/math] | [math]\displaystyle{ x^{e_{1}}_{2} }[/math] | [math]\displaystyle{ x^{e_{1}}_{c} }[/math] (消费者直接使用资源) | [math]\displaystyle{ x^{e_{1}}_{e_{1}} }[/math](未进入生产的资源暂取0) | [math]\displaystyle{ x^{e_{1}}_{e_{2}} }[/math] (生态过程,暂忽略取0) | 0 |
| 年龄4 | [math]\displaystyle{ x^{e_{2}}_{1} }[/math] | [math]\displaystyle{ x^{e_{2}}_{2} }[/math] | [math]\displaystyle{ x^{e_{2}}_{c} }[/math] (消费者直接使用资源) | [math]\displaystyle{ x^{e_{2}}_{e_{1}} }[/math](生态过程,暂忽略取0) | [math]\displaystyle{ x^{e_{2}}_{e_{2}} }[/math] (未进入生产的资源暂取0) | 0 |
| 排放E1 | [math]\displaystyle{ x^{E_{1}}_{1}=\bar{x}^{1}_{e_{1}} }[/math] | [math]\displaystyle{ x^{E_{1}}_{2}=\bar{x}^{2}_{e_{1}} }[/math] | [math]\displaystyle{ x^{E_{1}}_{c}=\bar{x}^{c}_{e_{1}} }[/math](劳动力再生产废物排放) | [math]\displaystyle{ x^{E_{1}}_{e_{1}} }[/math](排放不直接成为资源取0) | [math]\displaystyle{ x^{E_{1}}_{e_{2}} }[/math](排放不直接成为资源取0) | 0 |
| 排放E2 | [math]\displaystyle{ x^{E_{2}}_{1}=\bar{x}^{1}_{e_{1}} }[/math] | [math]\displaystyle{ x^{E_{2}}_{2}=\bar{x}^{2}_{e_{1}} }[/math] | [math]\displaystyle{ x^{E_{2}}_{c}=\bar{x}^{c}_{e_{1}} }[/math](劳动力再生产废物排放) | [math]\displaystyle{ x^{E_{2}}_{e_{1}} }[/math](排放不直接成为资源取0) | [math]\displaystyle{ x^{E_{2}}_{e_{2}} }[/math](排放不直接成为资源取0) | 0 |
研究思路和下一步工作
- 收集科学家生命和学术生命数据(对一个论文集做姓名识别、学术年龄识别、性别识别、统计每个科学家的每年发表的论文数量和每年被引次数)
- 计算每一位科学家的半衰期(以及统计分布函数和平均值),和相应的学术年龄的一半作比较,和论文、期刊的半衰期作比较
- 对个体的半衰期做统计研究、相关性分析(例如,科学家的性别、总被引次数、总论文数量、领域等和半衰期的关系)
参考文献
- ↑ Philip M. Davis, Journal Usage Half-Life, Phil Davis Consulting https://publishers.org/sites/default/files/uploads/PSP/journalusagehalflife.pdf
- ↑ Poynard T, Munteanu M, Ratziu V, Benhamou Y, Martino VD, Taieb J, et al. (2002) Truth Survival in Clinical Research: An Evidence-Based Requiem?. Ann Intern Med., 136:888-895. http://doi.org/10.7326/0003-4819-136-12-200206180-00010
- ↑ Poynard, T., Thabut, D., Munteanu, M., Ratziu, V., Benhamou, Y., & Deckmyn, O. (2010). Hirsch Index and Truth Survival in Clinical Research. PLoS ONE, 5(8), e12044. http://doi.org/10.1371/journal.pone.0012044.
本分类目前不含有任何页面或媒体文件。