10.3969/j.issn.1003-9767.2021.17.015
基于词向量的情感新词发现研究
本文首先用分词工具对收集的大量语料文档进行预处理,并进行分词和词性标注;其次,编写脚本对已经词性标注的语料库按照情感词的词性进行提取,建立候选情感词库,并用候选情感词库与外部情感词库取交集得到基准情感词表再次,用Word2Vec工具对自己创建的候选情感词库进行词向量训练,参照基准情感词表,计算情感词之间的distance值;最后,比较distance值判定情感词,即值越大则词汇之间的语义相似度就越高,从而按照距离远近选择情感新词.
情感新词;分词;Word2Vec;词向量
33
TP391.1(计算技术、计算机技术)
汉语-乌兹别克语平行语料库自动构建方法研究项目编号:XJNUSYS2019B1O
2021-11-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
50-52