一种基于改进ML-KNN的微博文本分类方法
针对传统ML-KNN进行多标签文档分类时,忽略标签之间关联性的问题,笔者提出了一种基于改进的ML-KNN多标签微博短文本分类方法.该方法通过归一化互信息控制每对标签的相关性阈值.针对微博短文本的特征,在计算文本相似度时引入同义词词林进行语义特征扩展.通过数据集的实验测试,笔者所提方法在性能上优于传统的ML-KNN算法.
ML-KNN、微博、短文本、多标签分类
TP391.1(计算技术、计算机技术)
2018-08-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
42-44