10.3969/j.issn.1002-137X.2009.12.057
一种基于语义特征的逻辑段落划分方法及应用
引入了一种以逻辑概念为中心的段落化匹配方式.该方法建立在概念词典之上,通过分析待分类文本中所包含的逻辑概念,将待分类文本中表达相同意义的段落进行聚类分析以得到一个逻辑层次,并建立以此逻辑层次划分方法为基础的逻辑段落概念,然后以该逻辑段落作为依据来衡量不同的段落对于文本主题表示的贡献程度.同时,针对匹配过程中存在的多义词和同义词现象,引入了同义词概念扩充和关联词语扩充.实验证明,该方法能够获得更高的内容过滤准确率,有效提高分类效果.
概念、段落化、文本分类、概念词典
36
TP301(计算技术、计算机技术)
国家自然基金60873247;山东省自然基金Y2006G20;山东省高新自主创新专项工程2008ZZ28
2010-03-02(万方平台首次上网日期,不代表论文的发表时间)
共5页
227-230,256