结合表示学习和迁移学习的跨领域情感分类
针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息, 且在迁移过程中存在负面迁移的问题, 提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法.首先, 利用低维稠密的词向量对文本进行初始化, 通过分层注意力网络, 对文本中重要单词与句子的情感信息进行建模, 从而学习源领域与目标领域的文档级分布式表示.随后, 采用类噪声估计方法, 对源领域中的迁移数据进行检测, 剔除负面迁移样例, 挑选高质量样例来扩充目标领域的训练集.最后, 训练支持向量机对目标领域文本进行情感分类.在大规模公开数据集上进行的两个实验结果表明, 与基准方法相比, 所提方法的均方根误差分别降低1.5%和1.0%, 说明该方法可以有效地提高跨领域情感分类性能.
文本表示学习、迁移学习、类噪声估计、跨领域、情感分类
55
国家自然科学基金61772135, U1605251;中国科学院网络数据科学与技术重点实验室开放基金课题CASNDST201708, CASNDST 201606;可信分布式计算与服务教育部重点实验室主任基金2017KF01;赛尔网络下一代互联网技术创新项目NGII20160501
2019-08-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
37-46