结合词性分析与串频统计的词语提取方法
在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析,结果表明该方法能够提取得到电子文档中包括原子词与合成词在内的所有词语,并且准确率与召回率较之前的方法均有很大提高.优良的自动提词结果能够保证文本自动处理的性能,进而促进相关领域的自动化程度与性能的提高.
文本自动处理、词语提取、原子词、合成词、词性标记
30
TPL82
国家高技术研究发展计划863计划2008AA04Z107
2010-04-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
105-111