10.3778/j.issn.1002-8331.2009-0090
基于Word2Vec的WordNet词语相似度计算研究
当前大部分WordNet词语相似度计算方法由于未充分考虑词语的语义信息和位置关系,导致相似度的准确率降低.为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似度的新方法.在构建WordNet数据集时提出一种新形式,不再使用传统的文本语料库,同时提出信息位置排列方法对数据集加以处理.利用Word2Vec模型训练WordNet数据集后得到向量表示.在公开的R&G-65、M&C-30和MED38词语相似度测评集上完成了词语相似度计算任务,从多个角度进行了Pearson相关系数对比实验.结果显示该文计算的相似度值与人工判定值计算取得的Pearson相关系数指标得到了显著提升.
词语相似度;WordNet;Word2Vec;同义词集标号
58
TP391(计算技术、计算机技术)
山东省自然科学基金;教育部产学合作协同育人项目;曲阜师范大学交叉学科研究项目;赛尔网络下一代互联网技术创新项目
2022-02-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
222-229