10.11925/infotech.2096-3467.2022.0145
基于超图注意力网络的生物医学文本分类方法
[目的]融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果.[方法]使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序、语义及语法信息,通过提出的交叉注意力机制网络将文本级超图和标签语义信息进行特征融合实现文本分类任务.[结果]在数据集PM-Sentence数据集上的实验结果表明,所提模型相较于基线模型在综合评价Fl指标上最大提高2.34个百分点.[局限]构建的数据集有待扩充,对所提模型用于该领域其他任务的适用性有待进一步研究.[结论]所提模型提升了生物医学文本的分类效果,为知识检索、知识挖掘等知识服务应用提供了有效支持.
文本分类、文本级超图、交叉注意力机制、生物医学领域、标签信息融合
6
TP391(计算技术、计算机技术)
国家重点研发计划2019YFB1406303
2023-03-30(万方平台首次上网日期,不代表论文的发表时间)
共12页
13-24