分类:科学计量学导引

来自Big Physics
Jinshanw讨论 | 贡献2018年12月5日 (三) 11:50的版本 →‎粗粒化


核心思路和理念

基于网络科学的大科学学

系联、间接影响

从科学(作者、论文、概念)到科学,从科学(论文)到技术(专利),从技术到技术,从科学和技术到产品,从产品到产品,从产品到研发经费,从科学研究到科学的传播和学习

数据框架、问题框架、计算分析方法、实践检验、促进科学技术的发展转播和学习

为了建立这个框架而做的具体研究


本书的写作目的:把科学计量学的研究对象、研究问题和典型思维方式以及分析方法,以及这个学科如何服务于社会和其他学科,用统一的框架呈现出来,促进学科的成熟和发展。将来,这个学科的研究就可以表述成为:在这个基础数据框架(有必要也是可以更新这个数据框架的)上,我们研究什么问题,我们需要什么方法,可以发挥什么作用。

科学计量学的学科大图景

典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界以及其他学科的关系。暂时见[吴金闪的工作和思考]博客站点上的[什么是科学计量学]。

科学计量学是以科学家(广义的,包含研究科学家、技术发明者、以及相关的期刊出版参与和管理者、科技项目和基金管理者、传播科学的老师、接受传播的学生和大众等)的研究学习和教学活动、科学家活动的结果记录,以及跟这些活动相关的这些记录的审稿、出版、传播以及科学研究项目和基金的管理等,为研究目标,旨在促进科学的发展、科学家的培养和成长、科学的传承和传播,的一门科学。

科学和科学研究

可计算的数学模型,现实,可证伪性和可重复性,尽量忠实尽量简单的表示

概念网络:知识高速公路

概念网络、概念网络与科学研究和科学传播的关系

科学计量学的数据

科学计量学的数据框架

作者-论文-概念三层网络框架,发明人-专利-技术三层网络框架,性别、位置(必要的时候可以成为网络)、期刊等数据作为顶点的属性 3layer.jpg Patent Paper.png

科学计量学数据的精炼

作者识别

引用骨架识别和赋权

粗粒化

为什么需要粗粒化。 [1]指出来为什么从评价的角度,粗粒化也就是论文聚类是重要的。


粗粒化怎么做?

[2]发展了网络科学聚类算法(CWTS聚类算法)来用于文章聚类。

[3]把自然语言处理用于文章聚类。

[4]发展了把引用和文本结合的聚类方法。


自然语言处理技术word2vec[5]、GloVe引用错误:没有找到与</ref>对应的<ref>标签

[6]

[7]

[8]

[9]

[2]

[3]

[4]

[5]

[10]

[11]

</references>

  1. 引用错误:无效<ref>标签;未给name属性为Waltman:Citation的引用提供文字
  2. 2.0 2.1 Waltman, L., & van Eck, N. J. (2012). A new methodology for constructing a publication-level classification system of science. Journal of the American Society for Information Science and Technology, 63(12), 2378–2392.
  3. 3.0 3.1  Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77–84.
  4. 4.0 4.1  Glänzel, W., & Thijs, B. (2017). Using hybrid methods and `core documents’ for the representation of clusters and topics: The astronomy dataset. In J. Gläser, A. Scharnhorst & W. Glänzel (Eds.), Same data—different results? Towards a comparative approach to the identification of thematic structures in science, Special Issue of Scientometrics. doi:10.1007/s11192-017-2301-6 .
  5. 5.0 5.1  Mikolov, Tomas; et al. "Efficient Estimation of Word Representations in Vector Space". arXiv:1301.3781.
  6. 吴金闪,狄增如,从统计物理学看复杂网络研究,物理学进展,24(1),18-46(2004).
  7. An Zeng, Zhesi Shen, Jianlin Zhou, Jinshan Wu, Ying Fan, Yougui Wang, H Eugene Stanley. 2017. "The science of science: From the perspective of complex systems." PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, 714, 1-74 (2017).
  8. Carl T. Bergstrom, Jevin D. West and Marc A. Wiseman, The Eigenfactor™ Metrics, Journal of Neuroscience, 28 (45) 11433-11434(2008). DOI: https://doi.org/10.1523/JNEUROSCI.0003-08.2008 .
  9. Boyack, K. W., & Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct citation: Which citation approach represents the research front most accurately? Journal of the American Society for Information Science and Technology, 61(12), 2389–2404.
  10.  Jeffrey Pennington, Richard Socher, and Christopher D. Manning. 2014. GloVe: Global Vectors for Word Representation.
  11.  https://radimrehurek.com/gensim/models/doc2vec.html, https://deeplearning4j.org/docs/latest/deeplearning4j-nlp-doc2vec .

本分类目前不含有任何页面或媒体文件。