10.3969/j.issn.1000-0135.2006.04.009
基于本体的数字图书馆检索模型研究(Ⅱ)——语义信息的提取
语义信息提取是一项较新的技术,本文讨论语义信息提取的定义、原理和思路,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程,即对于待处理的自然语言文字,将其进行分段和分句;针对拆分出的句子,进行分词和词性标注;在词性标注的基础上选择适当动词作为句子的语义谓词;判断该谓词是否属于语义谓词列表;再根据语义谓词来获取相关的语义实体,同时对于指示代词进行消解;最后对时间和地点维进行提取,并更新语义提取背景.本文还对开发过程中所用到的数据结构、关键算法进行了分析.
语义信息提取、本体
25
G35(情报学、情报工作)
国家自然科学基金70373047
2006-09-18(万方平台首次上网日期,不代表论文的发表时间)
共11页
451-461