10.3969/j.issn.1671-1815.2019.20.041
基于平滑逆频率和依存句法的句子相似度计算方法
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性.SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度.借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中“词语依存关系”三元组的相似性来度量句子间的相似度.实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84.4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度.
词平滑逆频率、依存句法、句子相似度计算
19
TP391.2(计算技术、计算机技术)
2019-11-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
278-282