10.11925/infotech.2096-3467.2018.1161
融合多粒度信息的文本向量表示模型
[目的]更加全面地提取文本语义特征,提高文本向量对文本语义的表示能力.[方法]通过卷积神经网络提取词粒度、主题粒度和字粒度文本特征向量,通过“融合门”机制将三种特征向量融合得到最终的文本向量,并进行文本分类实验.[结果]该模型在搜狗语料库文本分类实验上的准确率为92.56%,查准率为92.33%,查全率为92.07%,F1值为92.20%,较基准模型Text-CNN分别提高2.40%,2.05%,1.77%,1.91%.[局限]词序关系范围较小,语料库规模较小.[结论]该模型可以更加全面地提取文本语义特征,得到的文本向量对文本语义表示能力更强.
文本分类、词向量、卷积神经网络、主题模型
3
TP393;G35(计算技术、计算机技术)
中央高校基本科研业务费专项前瞻性发展策略研究资助项目“基于大数据技术的跨境电商政府管理范式研究”NW2018004;国家自然科学基金面上项目“基于演化本体的网络舆情自适应话题跟踪方法研究”项目71373123的研究成果之一
2019-11-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
45-52