DOI：10.3969/j.issn.1002-1965.2013.11.028

开放信息抽取技术的现状研究

引用

摘要：

如何高效地自动理解网络上出现的海量文本信息，日益成为了个严峻的考验。美国华盛顿大学图灵中心提出的开放信息抽取，是一个有效的解决方法。它具有领域的独立性，无监督抽取，对大量文本的可伸缩性等特点。该论文首先介绍了开放信息抽取系统的主要功能，然后详细论述了三个主要的开放信息抽取系统的特点、组成部分以及优缺点，接着分析了开放信息抽取系统的改进方法和发展趋势。最后对未来进行展望。

关键词：开放信息抽取、无监督抽取、关系短语、论元抽取、语义角色标注、开放语言学习

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金“基于语言网络的文本主题中心度计算方法研究”61075047;国家“十二五”科技支撑计划项目“面向外文科技文献信息的知识组织体系建设与应用示范”2011BAH10B00课题五“信息资源自动处理、智能检索与 STKOS 应用服务集成”的研究成果之一。

在线出版日期：2013-12-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：145-148,186

英文信息展示

期刊专题