10.3778/j.issn.1002-8331.2009.14.001
非结构化信息抽取关键技术研究探讨
以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章分析与理解技术、句法分析技术、图算法与图挖掘技术、词计算技术、快速全文检索技术等;该文探讨的是不仅要从文本中获取简单子句中的关系,还要获得跨句子、段落中的实体关系.
信息抽取、内在认知机理、命名实体识别、共指消解、机器学习
45
TP391(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60675030;江西省自然科学基金the Natural Science Foundation of Jiangxi Province of China under Grant 0511035, 2007GZS0358
2009-06-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
1-6,21