分类:感想类论文识别和比例

来自Big Physics
Jinshanw讨论 | 贡献2021年3月7日 (日) 11:31的版本 →‎研究背景和动机
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)


研究背景和动机

在中国学术界,在很多领域里面,感想类呼吁类、个人经验类、思想类思辨类论文很多,科学研究类的论文很少[1],相反国外的研究数据分析类的比较多[2]。我想正式来看看一看,哪些领域里面比较多,多的占多大比例。如果还能够和国外相应领域做个比较,那就更好了。甚至进一步,这个思路还可以拓展,例如进一步分析一下实验实证类文章的比例之类的。

一定程度上,一个学科的成熟与否得看这类文章的比例,很高,则肯定是不成熟的。因此,看看这个比例,做做学科之间的对比、时间上的对比、国内外的对比[3],会很有意思。

如果再进一步研究一下这些论文的被引次数,其他被引模式(网络分析,例如集团结构之类的,也就是是不是聚成团),就更有意思了。

甚至,还可以再搞一个这类论文的数量和被引次数排行榜。

思辨类研究,只有已经具有大量研究经验的人来做,那也得极少做,才不是误国误民。否则就是历史的罪人,学科的罪人。

为了更好的学术土壤,不怕死的,来一起努力!

研究方法

我们打算用有监督学习下的自然语言处理,或者甚至用现有的自然语言处理模型,例如情感识别,来做论文分类。

如果用有监督学习,则第一先需要准备标注好的论文当做训练样本。这个需要选择一个很好的能够输出论文标题和摘要的数据库,然后,领域也能平衡一点,来让领域专家做好标记。

第二,就是用自然语言处理把标题和摘要做成状态矢量,接着通过训练集来训练分类器。

第三,也就是最后,就是分学科领域统计一下这个比例。如果合适,做一下时间的、领域的、国内外的对比。

必要的时候,在选择什么文章来标记的时候,需要用到active learning(主动学习,就是从当前已有训练集来训练模型,找出来下一步应该标记哪些论文成为训练集的一部分)框架。实际上,这个训练出来的模型很可能具有很强的迁移能力:一个领域里面的感想类论文的特征,可能在另一个领域里面的感想类论文的特征非常像。

实施方案

  1. 选择合适的领域
  2. 对每个领域的论文制定一套相容的分类系统(感想类口号类,个人经验类,思想类思辨类,实证研究类等等。[1][3] 就用思辨类、质性研究、量化研究这个研究方法对教育类论文做了分类。可以参考。其他领域需要根据领域研究方法做合适的调整。)
  3. 选择期刊,获得标题摘要(这个由课题组协调提供)
  4. 做论文标注
  5. 训练和检验基于自然语言处理的论文类别识别模型
  6. 运用模型做识别论文类别
  7. 简单统计分析
  8. 不同类论文的引文网络特征,作者特征等进一步分析

论文分类

按照研究方法来分类可能是比较合适的。对于教育研究,可能口号感想类(连思辨都没有,只有观点)、思辨类(有观点,主要通过思辨来论证观点)、质性研究(个案数据分析、个人经验分类分析)、定量分析(多样本调查或者实验得到数据以后,做数据分析)是比较合适的。增加一个转述或者综述的二手论文分类也可以。

对于物理类,可能实验类(做实验、分析数据、被现有理论和实验做对比)、理论类(建模、计算,和已有实验作对比,或者提出可能的实验)、设想类方案类(对领域提出前瞻性的设想)、综述类论文是比较合适的。

对于环境类,

对于法学类,

对于经济学类,

标注规范

  1. 通读论文
  2. 对论文的研究问题和研究方法做总结,也就是WHWM,说了什么,怎么说的,为什么这样说为什么说这个,我觉得怎么样
  3. 对论文按照以下四个维度做标注
    1. 研究方法:第一类感想类论文,第二类思辨类论文,第三类实验或者实证类论文
    2. 逻辑:第一类逻辑错误,第二类逻辑不严密但是也没错,第三类逻辑严密
    3. 是否需要教育专业能力(不管是经验,知识,还是思维,都算)
    4. 是否对教和学有直接或者间接的促进作用(可以进一步分成没有,有直接作用,有间接作用).
  4. 如果出现介于两类之间,可以标记到两类之间。例如有思辨但是思辨的层次非常低,基本上就是有感而发,可以考虑给1.5分(不要再细了,只允许有0.5分的间隔)
  5. 序,书评,编者按,读者来信等不进入本次标注

参考文献

  1. 1.0 1.1 陆根书,刘萍,陈晨,刘琰.中外教育研究方法比较——基于国内外九种教育研究期刊的实证分析[J].高等教育研究,2016,37(10):55-65. 
  2. Hutchinson, S.R., Lovell, C.D. A Review of Methodological Characteristics of Research Published in Key Journals in Higher Education: Implications for Graduate Research Training. Research in Higher Education 45, 383–403 (2004). https://doi.org/10.1023/B:RIHE.0000027392.94172.d2 
  3. 3.0 3.1 王树涛,顾建民.国际教育科学研究范式的演变与趋势——基于2010—2019年文献计量的分析[J].教育研究,2020,41(09):135-145. 

子分类

本分类有以下24个子分类,共有24个子分类。