分类:物理学概念网络和学习
来自Big Physics
研究背景和问题
根据概念地图以及汉字学习和检测研究[1]的原理——概念网络上的广义投入产出分析,我们可以来做物理学学科概念网络上的学习和检测的研究。
原则上,我们应该先有一个物理学学科概念网络。但是,这个东西事实上没有整理好的形式。不过,其实arxiv论文全文、Wikipedia物理类词条集合以及词条之间的联系、物理教材的全文、美国物理学会(APS)的PACS分类代码树,合起来提供了一个相当可用的素材。因此,第一步,我们可以通过这几个素材来建立概念网络。概念网络原则上包含:概念和概念之间的关系连词,但是,初步形式可以忽略连词,仅仅建立联系。建立集合和联系的方法可以是Wikipedia的词条和词条之间的超链接,可以是全文经过word2vec处理之后的最相似(相似性截断)的概念,以及两者的某种混合。联系的方向可以是人工审阅,或者某种机器学习算法。
一旦有了概念网络,我们还要统计使用频率。这个可以简单从语料库(例如,仅仅arxiv全文,或者再加上Wikipedia、教材等)统计得来。
有了概念和使用频率,那么,我们就可以来做广义投入产出分析了,例如把使用频率当做外界,来做PageRank或者投入产出分析,就可以得到每一个物理概念的重要性。
同时,我们还可以做检测算法的研究。
更加重要的事情是,通过这个工作,我们发展方法、展示可以这样做和这样做的好处,等到将来有了更好的学科概念网络,我们就可以得到具有实用性的系统,用于指导学科的教和学,还有考试。
同时,这个研究也将是以科学家的活动记录尤其是文献数据为基础的科学计量学服务于教和学的第一个例子。教和学,应该是科学学的应用学科。
研究思路和下一步工作
- 用word2vec处理语料或者基于Wikipedia、教材得到概念集合、概念间联系,在这个里面可能还得用tf-idf之类的来取出来专业词汇
- 对语料库做词频统计
- 在概念网络和使用频率的基础上,做广义投入产出分析、高效检测算法的研究(概率推断)
- 看得到的结论的对于学习、教学、考试的含义
- 是不是可以做一下学习或者检测的实验研究,或者至少专家教学知识选择的对比研究
参考文献
- ↑ Xiaoyong yan, Ying Fan, Zengru Di, Shlomo Havlin, Jinshan Wu, Efficient learning strategy of chinese characters based on network approach, PloS ONE, 8, e69745 (2013) DOI: 10.1371/journal.pone.0069745.
本分类目前不含有任何页面或媒体文件。