分类:Measuring prerequisite relations among concepts

来自Big Physics
Safin讨论 | 贡献2021年10月24日 (日) 16:04的版本 →‎总结和评论
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)


Chen Liang, Zhaohui Wu, Wenyi Huang, and C. Lee Giles. 2015. Measuring prerequisite relations among concepts. In Proceedings of EMNLP. 1668-1674

Abstract

A prerequisite relation describes a basic relation among concepts in cognition, education and other areas. However, as a semantic relation, it has not been well studied in computational linguistics. We investigate the problem of measuring prerequisite relations among concepts and propose a simple link-based metric, namely reference distance (RefD), that effectively models the relation by measuring how differently two concepts refer to each other. Evaluations on two datasets that include seven domains show that our single metric based method outperforms existing supervised learning based methods.

总结和评论

这篇文章主要研究,在完成概念的抽取,并已经形成概念的引用网络之后,如何确定概念之间的先决关系。大的背景是,像wikipedia这种词条之间的引用关系是不能告诉我们词条之间的方向的,而研究先决关系可以用于确定词条或者说概念之间的方向。

所谓的先决,是在学习某一个概念之前,必须要先学会的概念,例如,如果为了学习A,必须弄懂B,则B先决于A。

根据Frame semantics理论[1],先决关系是学习,组织,应用,创造知识的认知过程中,在概念之间存在的一种天然的依赖关系,并且先决关系在教和学的领域有一定的研究,但是在计算机语义学领域很少研究,而且,传统方法研究先决关系,通常采用机器学习[2],比较复杂,因此,这篇文章的作者在计算机语义学领域研究先决关系,提出了一种比传统的机器学习更加简单的方法。

相比先决关系,更普遍的是概念之间引用关系, 比如网页之间的超链接,文献之间的引用,作者认为,一个简单的引用关系无法形成先决关系,但是一定数量的引用关系,情况就不一样。根据frame semantics理论[1],为了理解一个概念,必须把与之相关的所有知识都理解,这里的知识可以看作是一系列相关概念集和,因此,一个概念可以用与之相关的概念来表示。假如概念A的大部分相关概念引用概念B,但B的相关概念没有引用A,则B很可能是A的一个先决条件,那如何来度量呢?

作者设计了一个函数,把一对概念映射成一个实数,用于度量A需要B(B先决A)的程度。也就是,在矢量空间上计算两个相关概念相互引用时的引用距离[math]\displaystyle{ RefD(A, B) = \frac{ \sum_{i=1}^k r(c_{i}, B) w(c_{i}, A) }{ \sum_{i=1}^k w(c_{i}, A) } - \frac{ \sum_{i=1}^k r(c_{i}, A) w(c_{i}, B) }{ \sum_{i=1}^k w(c_{i}, B) } }[/math],其中,[math]\displaystyle{ C=\{c_{1},...,c_{k}\} }[/math]是概念空间,包含所有概念, [math]\displaystyle{ w(c_{i}, A) }[/math]是度量概念[math]\displaystyle{ c_i }[/math]对概念[math]\displaystyle{ A }[/math]重要性的权重, [math]\displaystyle{ r(c_{i}, A) }[/math][math]\displaystyle{ c_{i} }[/math]是否引用[math]\displaystyle{ A }[/math]

作者认为他们的工作,关注更一般的概念的先决关系;没有使用机器学习的feature,而是利用单个指标;方法更加易于解释。

更进一步,这项工作,可以作为基础用于构建概念层次,并且可以作为教学的辅助工具;可以用于其它需要衡量先决关系的邻域,比如文章和书的阅读顺序;[math]\displaystyle{ RefD }[/math]可以引入到已有的监督模型,以提高准确度;可以用于对一个概念的不同先决关系的排序;可以从富连接的结构中,比如wikipedia, 科研文献等,获得更多的信息。

小结,作者利用概念A的相关概念c引用B的程度来度量A和B之间的先决关系,也许可以直接利用概念A直接引用B的程度来度量二者的先决关系,变间接为直接。

下一步

  1. 找找作者的后续工作,或者他人的工作是否有改进
  2. 尝试一下直接的方法,去掉间接引用,来度量先决关系,找到概念之间的方向
  3. 可以在wikipedia是数学词条上实验,因为其本身比较严谨

参考文献

  1. 1.0 1.1 Charles J Fillmore. 2006. Frame semantics. Cognitive linguistics: Basic readings, 34:373–400.
  2. Partha Pratim Talukdar and William W Cohen. 2012. Crowdsourced comprehension: predicting prerequisite structure in wikipedia. In Proceedings of the Seventh Workshop on Building Educational Applications Using NLP, pages 307–315. Association for Computational Linguistics.

本分类目前不含有任何页面或媒体文件。