10.3772/j.issn.1000-0135.2012.04.001
主题舆情分析中的语义Web文本分类研究
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.
本体、语义相似度、文本分类、K最近邻
31
TP3;F81
2012-05-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
340-344