10.11925/infotech.2096-3467.2022.0472
跨语言情感分析研究综述
[目的]对跨语言情感分析的研究脉络进行梳理总结.[文献范围]以Web of Science数据库为检索平台,以TS=cross lingual sentiment OR cross lingual word embedding为检索式,筛选90篇文献进行述评.[方法]根据跨语言情感分析所采用的技术进行分类概述,包括基于机器翻译及其改进、基于平行语料库、基于双语情感词典三种早期的主要方法,再到引入Word2Vec和GolVe等词向量模型后,基于跨语言词向量模型的方法,最后到2019年以来基于Multi-BERT等预训练模型的方法.[结果]总结跨语言情感分析相关研究的主要思路、方法模型、不足之处等,分析现有研究覆盖的语言、数据集及其性能.发现虽然Multi-BERT等预训练模型在零样本的跨语言情感分析上取得较好性能,但是仍然存在语言敏感性问题.早期的跨语言情感分析方法对现有研究仍有一定指导和参考价值.[局限]部分跨语言情感分析模型属于混合模型,分类时仅按照主要方法进行归纳.[结论]展望跨语言情感分析的未来发展和亟待解决的问题.随着预训练模型对多语言语义的深层次挖掘,适用于更多更广泛语种的跨语言情感分析模型将是未来发展方向.
跨语言、多语言、情感分析、双语词嵌入
7
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项资金项目2022JJ006
2023-05-09(万方平台首次上网日期,不代表论文的发表时间)
共21页
1-21