期刊专题

10.11925/infotech.2096-3467.2019.0081

基于KACC模型的文本分类研究

引用
[目的]通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果.[方法]改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验.[结果]KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值三方面均优于现有模型,分类准确率达97.4%.[局限]实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究.[结论]KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果.

文本分类、关键词抽取、注意力机制、胶囊网络、类别标签表示

3

TP391(计算技术、计算机技术)

国家自然科学基金项目“面向开源软件复用的程序分析基础理论及方法研究”61772078;北京林业大学热点追踪项目“互联网+生态站关键技术研究”项目2018BLRD18的研究成果之一

2019-12-13(万方平台首次上网日期,不代表论文的发表时间)

共9页

89-97

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

3

2019,3(10)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn