10.3969/j.issn.1002-1965.2013.11.028
开放信息抽取技术的现状研究
如何高效地自动理解网络上出现的海量文本信息,日益成为了个严峻的考验。美国华盛顿大学图灵中心提出的开放信息抽取,是一个有效的解决方法。它具有领域的独立性,无监督抽取,对大量文本的可伸缩性等特点。该论文首先介绍了开放信息抽取系统的主要功能,然后详细论述了三个主要的开放信息抽取系统的特点、组成部分以及优缺点,接着分析了开放信息抽取系统的改进方法和发展趋势。最后对未来进行展望。
开放信息抽取、无监督抽取、关系短语、论元抽取、语义角色标注、开放语言学习
TP18(自动化基础理论)
国家自然科学基金“基于语言网络的文本主题中心度计算方法研究”61075047;国家“十二五”科技支撑计划项目“面向外文科技文献信息的知识组织体系建设与应用示范”2011BAH10B00课题五“信息资源自动处理、智能检索与 STKOS 应用服务集成”的研究成果之一。
2013-12-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
145-148,186