10.11925/infotech.2096-3467.2019.0081
基于KACC模型的文本分类研究
[目的]通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果.[方法]改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验.[结果]KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值三方面均优于现有模型,分类准确率达97.4%.[局限]实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究.[结论]KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果.
文本分类、关键词抽取、注意力机制、胶囊网络、类别标签表示
3
TP391(计算技术、计算机技术)
国家自然科学基金项目“面向开源软件复用的程序分析基础理论及方法研究”61772078;北京林业大学热点追踪项目“互联网+生态站关键技术研究”项目2018BLRD18的研究成果之一
2019-12-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
89-97