基于序列的文本自动分类算法
提出了一种基于序列的文本自动分类算法.该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权.对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列.在中文文本分类实验中,可以达到83%的BEP值.此外,该算法在实际系统中容易实现.
序列、概念节点、自动分类、相关度
13
TP18(自动化基础理论)
国家科技攻关项目96-743-01-05-01
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
783-789