分类:概念地图自动制作

来自Big Physics


概念自动抽取和关系自动抽取是概念地图绘制技术,或者说知识图谱构建技术,中的核心功能模块。当然,目前科学界也并没有完全解决这些问题。不过,至少有一些可用的方法了。如果采用这样的自动抽取技术和人工干预相结合,就有可能可以得到能用的概念地图。另一方面,有了概念地图如何使用,如何结合语料来更好地完成问答题、推理等后续任务,也是一个还没有完全解决的问题。

在这个项目中,我们基于前人(包含我们自己)的研究工作,暂时做出来一个能用的概念地图自动制作程序,并放出来给大家使用,和我们的概念地图绘制软件Lynkage一起。将来,可以随着用户对程序产生的地图的修改数据的积累以及自动抽取和运用方法研究的提高,可以进一步提供更好的产品。

目前的设计方案是:用户提供语料,用户选定概念和/或连词,程序得到概念地图的逻辑形式,布局算法对概念地图的逻辑形式做布局得到概念地图。

其中,用户在其所提供的语料上标记好概念和连词以后,可以选择几种不同的模式:仅限于用户选定概念,仅限于用户选定连词,在用户选定概念基础上做谨慎扩张概念,在用户选定连词基础上谨慎扩张连词,基于语法分析抽取概念,基于语法分析抽取连词,基于命名实体识别抽取概念,基于实体关系识别抽取连词,在领域知识范围内推荐概念和连词。

这个算法实现和测试一下。

参考文献

概念抽取和概念关系挖掘词条下面整理了一部分方法和相应的文献。

可用的工具包

语料

应用场景

长期来看,从教材论文等语料中构建学科概念地图。

目前,还有一个使用场景:用户选择一段文本,希望得到这段文本的概念地图。用户可以帮助系统做一些概念和连词的标记,或者更懒的用户,直接就是提供一些文本。这样的场景可以出现在例如记笔记中:用户看到一段话,想拿到一个可视化的帮助用户记忆和理解这段话的概念地图初稿,然后再来修改。

本分类目前不含有任何页面或媒体文件。