10.3778/j.issn.1002-8331.1106-0054
藏文文本编码识别方法研究
讨论了藏文编码识别与转换中的关键问题,介绍了藏文结构特点和统计学特征以及各种可能的识别准则,并进行分析比较.确定了使用以藏文的音节点间距规律和高频音节为特征的识别方法对方正Windows、方正Dos、同元、华光Windows、华光Dos、班智达、ASCII的藏文编码方案、ISO/IEC10646基本集、国家标准扩充集A的藏文编码识别,能够正确地将藏文文本与其他语言进行区分.在对目标样本的测试中,该算法的识别率可达100%.
藏文编码、藏文编码识别、音节点
49
TP391.1(计算技术、计算机技术)
国家教育部"长江学者与创新团队发展计划"藏文信息技术创新团队计划资助RT0975
2013-03-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
141-144