分类:概念抽取和概念关系挖掘
来自Big Physics
从书籍、论文等语料经过自然语言处理或者人工处理得到概念、概念关系,形成概念网络,或者知识地图,是大量后续研究的基础(见分类:概念网络和理解型学习,分类:科学计量学导引)。例如概念网络可以用于论文分类、创新性的度量、问答系统、阅读理解、教和学。这里有两个问题:如何从语料得到概念地图,如何用概念地图来做后续任务。当然,这两个任务不一定要合起来做,可以在某些概念地图的基础上做后续研究(例如我们的概念学习顺序和检测算法),也可以仅仅研究从语料到概念网络。
实际上,Google知识图谱任务就已经以Wikipedia等语料和其他网络语料为基础构建了很大规模的“常识和常识之间的联系”数据库。一方面,我们需要去了解一下他们的算法是什么。另一方面,很有可能有联系的概念可以通过语料和自然语言处理算法来发现联系。同时,考虑到我们通常需要在更加专门的领域内构建概念网络,然后用于这个专门领域的研究和学习,所以,可能会存在更好的算法。
这个研究就专门在“科学计量学”(见分类:科学学)和“产品生产关系”(见分类:生产关系挖掘)两个小领域内来构建概念网络。前者需要从科学计量学论文语料库找出来,科学计量学的专有名词和这些专有名词之间的关系。后者,需要从一个叫做"How Prroducts Are Made"网站获得产品的生产过程和原材料的描述,把原材料和产品的类似化学反应的数据取出来。
所需要的论文数据和网站数据请跟我们联系。
这个工作的参考文献我们会慢慢补充上。
子分类
本分类有以下10个子分类,共有10个子分类。
C
E
S
科
分类“概念抽取和概念关系挖掘”中的页面
以下2个页面属于本分类,共2个页面。