10.3969/j.issn.1003-9767.2021.07.031
藏文句子相似度算法研究
笔者在空间向量模型的余弦相似度算法基础上,通过添加权重、词性和辞藻的方法提高句子相似度计算的准确性,并通过改进原有最长匹配原则的关键字查找方法来提高关键字的查找速度.在该算法中,相似度的准确性主要跟词性和权重有关,因为在单个句子的相似度比较过程中,词频起到的作用比较小,因此词性的标注与其可靠性非常重要.
藏文;空间向量模型;相似度;词性
33
TP391.1(计算技术、计算机技术)
"藏文句子相似度算法研究";西藏大学培育基金项目"基于深度学习的藏文文本自动摘要生成研究";西藏自治区教育厅"计算机及藏文信息技术国家级团队和重点实验室建设"
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
103-105