DOI：10.3321/j.issn:1002-8331.2002.16.033

基于概念的文本类别特征提取与文本模糊匹配

引用

摘要：

文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点.该文给出一种新的类别特征提取与文本匹配方法.首先对术语特征权进行了综合计算,然后基于概念网络术语-概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理.在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配.该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性.

关键词：概念网络、概念空间、特征提取、文本分类、模糊距离

所属期刊栏目：38

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金699282201;香港城市大学校科研和教改项目9640006

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：97-99,104

英文信息展示

期刊专题