融合多层次信息的海关同义词识别方法
在海关进出口商品文本信息中,往往会用不同的词语描述同一商品的特征,识别这些商品的特征同义词能更好地进行观点汇总,进而对同一类特征的商品进行涉税风险的防控.针对海关申报要素短语的特点,提出一种融合多层次信息的卷积神经网络模型,构建并训练了一个基于孪生和三级网络结构的Sentence-BERT,其对相近的要素短语具有更好的语义表示,弥补了word2vec短文本词嵌入特征离散稀疏的不足.利用多尺寸卷积核提取要素短语的不同特征.通过BiLSTM神经网络学习要素短语的语序信息,并利用注意力机制分配关键词权重.获得的全连接融合同义词语义特征和关键词特征,通过softmax层进行预测.实验证明,融合多层次信息的卷积模型比其他模型有更好的表现.
海关商品、同义词识别、要素短语、多层次信息、卷积神经网络
49
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金
2023-05-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
147-151