分类:科学计量学多层网络构建和应用

来自Big Physics
Jinshanw讨论 | 贡献2021年1月5日 (二) 11:28的版本


这是这个页面Concept Mapping of Scientometrics and its applications in scientometrical studies的中文版。


包含作者、论文、概念及其相互联系的科学学多层网络可以在任何一个学科甚至整个科学(自然科学、社会科学、术科)上构建,而且这样的多层网络一旦构建出来可以对这个学科的研究和教学起到非常大的作用。这个项目将尝试构建“科学计量学”这个领域的科学学多层网络,并且把构建出来的网络用于科学计量学这个领域的研究和教学[1]

包含哪些主体和联系

这个科学计量学的多层网络,或者说科学计量学概念地图包含的顶点有作者、论文、概念,包含的关系有:作者之间的师承关系、论文之间的引用关系、概念之间的逻辑关系、作者到论文的“写作”关系、论文到概念的“研究”关系。作者层还可以有作者所属的工作单位和国家等其他属性。

如何构建

为了构建这个网络,我们需要完成以下工作:

  1. 作者识别,作者和论文之间的关系的提取,作者师承关系的提取
  2. 概念和关系的提取,从论文中提取出来概念,以及概念之间的逻辑关系
  3. 论文引用关系,这个有现成的数据

数据

目前我们打算把科学计量学几个主要期刊的文章当做数据源,来完成以上的构建过程。数据已经下载了一部分,另一部分在合作者那边有。

技术和构建过程

人工和人工智能相结合。用现有的自然语言处理技术初步从论文提取概念、概念关系[2][3][4][5][6] 。用在此基础上人工标注的方法来校正从论文到概念、概念关系的映射。用校正以后的映射关系来训练自然语言处理模型,完成科学计量学概念地图的构建。

有什么用

完成科学计量学概念地图的构建之后,我们就可以用这个网络来看,科学计量学这个学科的演化发展,识别出来这个学科演化的过程中的一些关键论文和关键作者。还可以从静态的整个网络中找出来基础性、前沿性、前瞻性的概念(以及相关的论文和作者),并且结合被引次数和追热点程度等其他度量,来大概刻画论文(和作者)的创新性、追热点性和基础性。还可以研究这些主体之间的相互影响[7],例如某个科学家的工作间接促进了某个子领域的研究——也就是这个科学家没有对这个子领域的直接贡献,但是很多这个子领域的文章都手这个科学家的其他子领域的研究工作启发。

除了为科学计量学的研究服务之外,这个科学计量学概念地图还可以为科学学教材撰写和课程设计服务。例如,从中就可以整理出来哪些概念是基本概念、哪些概念是前沿概念,学习这些概念的时候最好按照大概什么样的顺序。

更一般的意义

从更一般的角度来说,本研究发展起来的学科概念地图构建技术、学科概念地图用于研究和教学的分析方法,都是具有一般意义的:我们完全可以把这些方法用到另一个学科上,来为另一个学科的研究和教学服务,也进一步来发展这些方法,提出新的问题。



References

  1. Jinshan Wu. "Infrastructure of Scientometrics:The Big and Network Picture." Journal of Data and Information Science, vol.4, no.4, 2019, pp.1-12. DOI: 10.2478/jdis-2019-0017
  2. John Giorgi and Xindi Wang and Nicola Sahar and Won Young Shin and Gary D. Bader and Bo Wang, End-to-end Named Entity Recognition and Relation Extraction using Pre-trained Language Models, arXiv cs.CL 1912.13415(2019).
  3. A. Bordes, N. Usunier, A. Garcıa-Duran, J. Weston, and O. Yakhnenko, “Translating embeddings for modeling multi-relational data,” in Proc. Adv. Neural Inf. Process. Syst., 2013, 2787-2795.
  4. J. Weston, A. Bordes, O. Yakhnenko, and N. Usunier, “Connecting language and knowledge bases with embedding models for relation extraction,” in Proc. Conf. Empirical Methods Natural Language Process., 2013, 1366-1371.
  5. S. Riedel, L. Yao, A. Mccallum, and B. M. Marlin, “Relation extraction with matrix factorization and universal schemas,” in Proc. Conf. North Amer. Chapter Assoc. Comput. Linguistics: Human Language Technol., 2013, 74-84.
  6. Maximilian Nickel, Kevin Murphy, Volker Tresp, Evgeniy Gabrilovich. A Review of Relational Machine Learning for Knowledge Graphs. Proceedings of the IEEE 2016.
  7. Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu, Interrelations among scientific fields and their relative influences revealed by an input–output analysis, Journal of Informetrics 10, 82-97(2016). doi:10.1016/j.joi.2015.11.002

子分类

本分类有以下2个子分类,共有2个子分类。