分类:科学计量学导引

来自Big Physics
Jinshanw讨论 | 贡献2018年12月5日 (三) 11:57的版本


核心思路和理念

基于网络科学的大科学学

系联、间接影响

从科学(作者、论文、概念)到科学,从科学(论文)到技术(专利),从技术到技术,从科学和技术到产品,从产品到产品,从产品到研发经费,从科学研究到科学的传播和学习

数据框架、问题框架、计算分析方法、实践检验、促进科学技术的发展转播和学习

为了建立这个框架而做的具体研究


本书的写作目的:把科学计量学的研究对象、研究问题和典型思维方式以及分析方法,以及这个学科如何服务于社会和其他学科,用统一的框架呈现出来,促进学科的成熟和发展。将来,这个学科的研究就可以表述成为:在这个基础数据框架(有必要也是可以更新这个数据框架的)上,我们研究什么问题,我们需要什么方法,可以发挥什么作用。

科学计量学的学科大图景

典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界以及其他学科的关系。暂时见[吴金闪的工作和思考]博客站点上的[什么是科学计量学]。

科学计量学是以科学家(广义的,包含研究科学家、技术发明者、以及相关的期刊出版参与和管理者、科技项目和基金管理者、传播科学的老师、接受传播的学生和大众等)的研究学习和教学活动、科学家活动的结果记录,以及跟这些活动相关的这些记录的审稿、出版、传播以及科学研究项目和基金的管理等,为研究目标,旨在促进科学的发展、科学家的培养和成长、科学的传承和传播,的一门科学。

科学和科学研究

可计算的数学模型,现实,可证伪性和可重复性,尽量忠实尽量简单的表示

概念网络:知识高速公路

概念网络、概念网络与科学研究和科学传播的关系

科学计量学的数据

科学计量学的数据框架

作者-论文-概念三层网络框架,发明人-专利-技术三层网络框架,性别、位置(必要的时候可以成为网络)、期刊等数据作为顶点的属性 3layer.jpg Patent Paper.png

科学计量学数据的精炼

作者识别

引用骨架识别和赋权

粗粒化

粗粒化就是把研究论文聚成类,可以是相当于概念或者主题的类,也可以是相当于学科或者学科方向的类。一般来说所聚出来的类有一定的层级结构。

为什么需要粗粒化。 [1]指出来为什么从评价的角度,粗粒化也就是论文聚类是重要的。


粗粒化怎么做?

[2]发展了网络科学聚类算法(CWTS聚类算法)来用于文章聚类。

[3]把自然语言处理用于文章聚类。

[4]发展了把引用和文本结合的聚类方法。


自然语言处理技术word2vec[5]、GloVe[6]、Doc2Vec[7]在词汇的基础上还考虑了词汇之间的语义联系,用来聚类。网络表示算法node2vec[8]也可以通过引用网络得到顶点的矢量表示。

粗粒化的结果怎么检验?

[9]对比了几种论文聚类的算法。

科学计量学的任务

科学领域及其相互关系

技术领域及其相互关系

科学-技术关系

科学-技术-经济相互关系

经济产业部门的相互关系

加上科学和技术到产品的联系

科学家活动的模式

科学出版的模式

评价指标和科研管理

[1]总结了关于影响因子的研究的现状、动机和未来方向。

教和学科学

科学计量学的思维方式和分析方法

科学计量学之科学思维和科学方法

网络科学的思想和技术

[10] 介绍了网络科学的基本精神,并把网络研究分成几个方面做了总结。 [11] 整理了用网络的思想和方法来研究科学学的工作。

关系为王

几何性,一切都是关系并且只有关系

直接和间接联系

一级近邻不需要网络分析,间接影响

新框架下的共现分析

作者-作者共现,共施引,共被引,作者-主题共现,主题-主题共现

统计分析

对排序指标的需求,均值,检验,百分比,h指数,领域归一化(需要网络分析)

[1]总结了关于影响因子的研究的现状、动机和未来方向。

作为分析技术的网络分析

主题分类,共施引,共被引,合作网络分析,Eigenfactor,IOfactor

典型方法用于典型问题

数据精炼问题的解决

粗粒化问题的解决

[9]对比了几种论文聚类的算法。

科学家活动模式分析

科学出版活动模式分析

评价指标和科研管理问题的解决

[1]总结了关于影响因子的研究的现状、动机和未来方向。 [12]把网络科学和PageRank算法用于期刊、作者、研究机构、论文影响力度量。

相互关系问题的分析

科学的教和学问题的分析

参考文献

  1. 1.0 1.1 1.2 1.3 Waltman, Ludo, A review of the literature on citation impact indicators, JOURNAL OF INFORMETRICS, 10(2) 365-391(2016), DOI: 10.1016/j.joi.2016.02.007 .
  2. Waltman, L., & van Eck, N. J. (2012). A new methodology for constructing a publication-level classification system of science. Journal of the American Society for Information Science and Technology, 63(12), 2378–2392.
  3.  Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77–84.
  4.  Glänzel, W., & Thijs, B. (2017). Using hybrid methods and `core documents’ for the representation of clusters and topics: The astronomy dataset. In J. Gläser, A. Scharnhorst & W. Glänzel (Eds.), Same data—different results? Towards a comparative approach to the identification of thematic structures in science, Special Issue of Scientometrics. doi:10.1007/s11192-017-2301-6 .
  5.  Mikolov, Tomas; et al. "Efficient Estimation of Word Representations in Vector Space". arXiv:1301.3781.
  6.  Jeffrey Pennington, Richard Socher, and Christopher D. Manning. 2014. GloVe: Global Vectors for Word Representation.
  7.  https://radimrehurek.com/gensim/models/doc2vec.html, https://deeplearning4j.org/docs/latest/deeplearning4j-nlp-doc2vec .
  8. 引用错误:无效<ref>标签;未给name属性为Leskovec:node2vec的引用提供文字
  9. 9.0 9.1 Boyack, K. W., & Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct citation: Which citation approach represents the research front most accurately? Journal of the American Society for Information Science and Technology, 61(12), 2389–2404.
  10. 吴金闪,狄增如,从统计物理学看复杂网络研究,物理学进展,24(1),18-46(2004).
  11. An Zeng, Zhesi Shen, Jianlin Zhou, Jinshan Wu, Ying Fan, Yougui Wang, H Eugene Stanley. 2017. "The science of science: From the perspective of complex systems." PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, 714, 1-74 (2017).
  12. Carl T. Bergstrom, Jevin D. West and Marc A. Wiseman, The Eigenfactor™ Metrics, Journal of Neuroscience, 28 (45) 11433-11434(2008). DOI: https://doi.org/10.1523/JNEUROSCI.0003-08.2008 .

本分类目前不含有任何页面或媒体文件。