10.13657/j.cnki.gxkxyxb.20180320.006
蒙古语词向量评测研究
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用.本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量.研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高.
词向量、CBOW模型、Skip-gram模型、词向量质量、语义语法相似度
34
TP391.1(计算技术、计算机技术)
内蒙古自治区自然科学基金项目"基于条件随机场的蒙古文命名体识别研究"2016MS0623;国家自然科学基金项目"基于神经网络的蒙汉机器翻译研究"61762072
2018-05-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
68-71