分类:科学计量学导引

来自Big Physics


核心思路和理念

基于网络科学的大科学学

系联、间接影响

从科学(作者、论文、概念)到科学,从科学(论文)到技术(专利),从技术到技术,从科学和技术到产品,从产品到产品,从产品到研发经费,从科学研究到科学的传播和学习

数据框架、问题框架、计算分析方法、实践检验、促进科学技术的发展转播和学习

为了建立这个框架而做的具体研究


本书的写作目的:把科学计量学的研究对象、研究问题和典型思维方式以及分析方法,以及这个学科如何服务于社会和其他学科,用统一的框架呈现出来,促进学科的成熟和发展。将来,这个学科的研究就可以表述成为:在这个基础数据框架(有必要也是可以更新这个数据框架的)上,我们研究什么问题,我们需要什么方法,可以发挥什么作用。

科学计量学的学科大图景

典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界以及其他学科的关系。暂时见[吴金闪的工作和思考]博客站点上的[什么是科学计量学]。

科学计量学是以科学家(广义的,包含研究科学家、技术发明者、以及相关的期刊出版参与和管理者、科技项目和基金管理者、传播科学的老师、接受传播的学生和大众等)的研究学习和教学活动、科学家活动的结果记录,以及跟这些活动相关的这些记录的审稿、出版、传播以及科学研究项目和基金的管理等,为研究目标,旨在促进科学的发展、科学家的培养和成长、科学的传承和传播,的一门科学。

科学和科学研究

可计算的数学模型,现实,可证伪性和可重复性,尽量忠实尽量简单的表示

概念网络:知识高速公路

概念网络、概念网络与科学研究和科学传播的关系

科学计量学的数据

科学计量学的数据框架

作者-论文-概念三层网络框架,发明人-专利-技术三层网络框架,性别、位置(必要的时候可以成为网络)、期刊等数据作为顶点的属性 3layer.jpg Patent Paper.png

科学计量学数据的精炼

  1. 以搜索引擎为基础的学术数据库:Google Scholar,Microsoft Academic Graph
  2. 科学学数据库:Web of Science, Scopus,Dimensions, OpenCitations, Lens, CrossRef, PubMed
  3. 领域科学学数据库:APS, MathSciNet, JEL, CAS
  4. 专利:USPTO
  5. 基金:NIH, NSF
  6. 书籍:Google ngram
  7. 知识库:Wikipedia,学科概念网络、汉字地图

文章数据包含:作者、标题、作者单位、期刊(名称、卷期页、年)、参考文献、摘要、全文、基金项目号标注、致谢、作者贡献说明 专利数据包含:发明人(单位)、标题、授权号、专利类别、参考文献、摘要、全文、转化 书籍:作者、出版商(地址、年)、词频、引文(?) 学科概念网络:包含概念和概念之间的关系

[1]把其中一些数据库做了介绍,并提到了一些做数据库对比的文章。 [2]提到了一些知识库可以当做科学学的研究对象。


需要再加入一些对比数据的参考文献。

作者识别

为什么会有姓名识别的问题?

不完整的名字,相同的名字,工作单位的迁移,研究领域的迁移,聚合和拆分的问题

姓名识别如何做?

[3]衡量了最简单的算法——姓的全部和名的第一个字母——的准确率。

[4][5][6][7]发展了更复杂的算法,例如中国人的姓名的识别、学术单位、研究领域信息用于姓名识别等。


姓名识别的结果如何检验?

Orcid数据([1]),ResearchGate数据,官方email数据,各个国家各个学术单位的统计数据,Norwegian模型[8]

[9]提供了一些可供检验的数据。

机构识别问题

引用骨架识别和赋权

粗粒化

粗粒化就是把研究论文聚成类,可以是相当于概念或者主题的类,也可以是相当于学科或者学科方向的类。一般来说所聚出来的类有一定的层级结构。

为什么需要粗粒化。 [10]指出来为什么从评价的角度,粗粒化也就是论文聚类是重要的。


粗粒化怎么做?

[11]发展了网络科学聚类算法(CWTS聚类算法)来用于文章聚类。

[12]把自然语言处理用于文章聚类。

[13]发展了把引用和文本结合的聚类方法。

自然语言处理技术word2vec[14]、GloVe[15]、Doc2Vec[16]在词汇的基础上还考虑了词汇之间的语义联系,用来聚类。网络表示算法node2vec[17]也可以通过引用网络得到顶点的矢量表示。

粗粒化的结果怎么检验?

[18]对比了几种论文聚类的算法。

科学计量学的任务

科学领域及其相互关系

技术领域及其相互关系

科学-技术关系

[19][20][21][22][23][24][25]利用专利引用学术论文的数据研究了科学和技术之间的关联。

科学-技术-经济相互关系

经济产业部门的相互关系

加上科学和技术到产品的联系

科学家活动的模式

科学出版的模式

评价指标和科研管理

[10]总结了关于影响因子的研究的现状、动机和未来方向。

教和学科学

科学计量学的思维方式和分析方法

科学计量学之科学思维和科学方法

网络科学的思想和技术

[26] 介绍了网络科学的基本精神,并把网络研究分成几个方面做了总结。 [27] 整理了用网络的思想和方法来研究科学学的工作。

关系为王

几何性,一切都是关系并且只有关系

直接和间接联系

一级近邻不需要网络分析,间接影响

新框架下的共现分析

作者-作者共现,共施引,共被引,作者-主题共现,主题-主题共现

统计分析

对排序指标的需求,均值,检验,百分比,h指数,领域归一化(需要网络分析)

[10]总结了关于影响因子的研究的现状、动机和未来方向。

作为分析技术的网络分析

主题分类,共施引,共被引,合作网络分析,

  1. 引用错误:无效<ref>标签;未给name属性为Harinarayana:Data的引用提供文字
  2. 引用错误:无效<ref>标签;未给name属性为Parinov:Data的引用提供文字
  3. 引用错误:无效<ref>标签;未给name属性为Milojević:Name的引用提供文字
  4. 引用错误:无效<ref>标签;未给name属性为Schulz:Name的引用提供文字
  5. 引用错误:无效<ref>标签;未给name属性为Kim:Name的引用提供文字
  6. 引用错误:无效<ref>标签;未给name属性为NTU:NameChinese的引用提供文字
  7. 引用错误:无效<ref>标签;未给name属性为Sinatra:Name的引用提供文字
  8. 引用错误:无效<ref>标签;未给name属性为Sivertsen:Norwegian的引用提供文字
  9. 引用错误:无效<ref>标签;未给name属性为Müller:NameData的引用提供文字
  10. 10.0 10.1 10.2 引用错误:无效<ref>标签;未给name属性为Waltman:Citation的引用提供文字
  11. 引用错误:无效<ref>标签;未给name属性为Waltman:ClusterCWTS的引用提供文字
  12. 引用错误:无效<ref>标签;未给name属性为Blei:LDA的引用提供文字
  13. 引用错误:无效<ref>标签;未给name属性为Glänzel:Cluster的引用提供文字
  14. 引用错误:无效<ref>标签;未给name属性为Mikolov:word2vec的引用提供文字
  15. 引用错误:无效<ref>标签;未给name属性为Pennington:GloVe的引用提供文字
  16. 引用错误:无效<ref>标签;未给name属性为Doc2Vec的引用提供文字
  17. 引用错误:无效<ref>标签;未给name属性为Leskovec:node2vec的引用提供文字
  18. 引用错误:无效<ref>标签;未给name属性为Boyack:Cluster的引用提供文字
  19. 引用错误:无效<ref>标签;未给name属性为Narin:Patent的引用提供文字
  20. 引用错误:无效<ref>标签;未给name属性为Narin:linkage1的引用提供文字
  21. 引用错误:无效<ref>标签;未给name属性为Narin:linkage2的引用提供文字
  22. 引用错误:无效<ref>标签;未给name属性为Narin:linkage3的引用提供文字
  23. 引用错误:无效<ref>标签;未给name属性为Narin:linkage4的引用提供文字
  24. 引用错误:无效<ref>标签;未给name属性为Verbeek:linkage的引用提供文字
  25. 引用错误:无效<ref>标签;未给name属性为Li:Linkage的引用提供文字
  26. 引用错误:无效<ref>标签;未给name属性为Wu:Network的引用提供文字
  27. 引用错误:无效<ref>标签;未给name属性为Zeng:Science2的引用提供文字

本分类目前不含有任何页面或媒体文件。