期刊专题

10.16652/j.issn.1004-373x.2019.10.007

不同维度下维吾尔语N-gram语言模型性能分析

引用
针时当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型.通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3~5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优.这一结论将有助于维吾尔语自然语言处理的发展.

N-gram语言模型、性能分析、SRILM、MITLM、困惑度、平滑算法、机器翻译

41

TN912.34-34;TP391.1

国家自然科学面向汉维机器翻译性能优化的关键技术研究61562081

2019-08-01(万方平台首次上网日期,不代表论文的发表时间)

共4页

27-30

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

41

2019,41(10)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn