10.3778/j.issn.1002-8331.1309-0432
基于条件随机场的藏文人名识别研究
基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具来进行训练和测试。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并针对人名与一般词语同形现象进行特征标签集的优化。
藏文人名、条件随机场、特征标签集
TP391(计算技术、计算机技术)
国家自然科学基金重点项目No.61132009。
2015-02-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
109-111,185