一种融合ACNN和Bi-LSTM半监督缩略语消歧方法
为了提高生物医学缩略语的消歧准确率,提出了一种融合ACNN和Bi-LSTM半监督缩略语消歧方法.以缩略语为中心,提取左右4个邻接词汇单元的词形信息、词性信息和语义信息作为消歧特征.使用Xgboost算法和LightGBM算法扩充训练语料,将扩充完的训练语料输入到这个模型中,使用非对称卷积神经网络(asymmetric convolutional neural networks,ACNN)和双向长短期记忆网络(bidirectional long short-term memory,Bi-LSTM)来提取特征,使用softmax函数进行语义分类.使用MSH语料来优化该模型并测试其消歧性能,实验结果表明:本文所提出模型只需使用少量的有标注语料,可以有效的提高缩略语消歧准确率.
缩略语、Xgboost、LightGBM、消歧特征、非对称卷积神经网络、双向长短期记忆网络
27
TP391.2(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;中国博士后科学基金;黑龙江省自然科学基金项目
2023-01-13(万方平台首次上网日期,不代表论文的发表时间)
共8页
30-37