融合领域本体的中文文本语义特征提取算法研究
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法.该算法利用基于种子-扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题.实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性.
文本语义特征、领域本体、算法
36
教育部博士研究生学术新人奖5052012104001;国家自然科学基金项目项目71073121的研究成果之一
2013-11-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
96-99