10.11925/infotech.2096-3467.2021.0793
弹幕视频的情感时间曲线聚类与传播效果
[目的]构建面向弹幕文本的情感曲线聚类模型,为视频传播效果预测提供新的决策方式.[方法]提出词向量扩充领域情感词典,优化情感分类器性能;采用综合权重等手段使情感时序平稳平滑;提出SBD度量K-shape聚类模型,分析情感时序模式、特征及传播效果.[结果]优化情感词典模型在多分类指标(主客观、极性分类)上F1值分别达到0.89和0.79,主客观分类器性能提升123%.对比多种时序度量聚类算法组合,SBD度量K-shape聚类模型在戴维森堡丁指数和轮廓系数指标上均性能更优.[局限]情感词典算法未完全考虑网络流行语或不含中心形容词的句子情形,情感时序聚类结果描述、解释程度需要进一步加深.[结论]基于领域情感词典-SBD-Kshape算法可以削弱弹幕文本非规整噪声及时序相位偏移的影响,聚类结果可作为识别传播效果差异的依据.
情感词典、情感曲线、时间序列
6
TP393;G250(计算技术、计算机技术)
北京市社会科学基金规划项目21GLB027
2022-10-08(万方平台首次上网日期,不代表论文的发表时间)
共14页
32-45