期刊专题

10.11925/infotech.2096-3467.2022.0109

在线评论可行动信息识别研究

引用
[目的]以评论文本为研究对象,研究可行动信息识别方法,为实践者发挥自身优势及弥补不足提供行动参考.[方法]将目标任务定义为句子级分类问题,提出一种基于文段的可行动信息识别模型SAII.基于BERT预训练模型对输入句子进行编码,建立词级别的上下文表征;枚举句子中不同范围的文段,引入文段注意力机制生成信息量丰富的文段级表征;为缓解噪声问题,提出多通道文段过滤机制,最大限度地保留接近关键元素原型的文段;融合提纯后的文段表示和上下文表示,自动识别可行动信息.[结果]在两个真实数据集上的实验结果表明,所提模型的效果最佳.与三类基线模型中的最优模型相比,SAII模型在Yelp数据集和RateMDs数据集上的F1指标分别提高7.91个百分点和5.42个百分点;2.10个百分点和2.73个百分点;1.94个百分点和1.46个百分点.[局限]仍需在多领域和多模态数据集上广泛验证模型的有效性.[结论]本文模型具备词级和文段级表征能力,有效提高了识别准确率,推动了用户生成内容的价值实现.

文本评论、文段模型、自然语言处理、可行动信息、BERT

6

TP391;G203(计算技术、计算机技术)

绿色发展大数据决策北京市重点实验室基金项目dm202103

2023-04-07(万方平台首次上网日期,不代表论文的发表时间)

共12页

1-12

暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

6

2022,6(12)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn