10.3778/j.issn.1002-8331.2009.22.040
运用有向图进行中文分词研究
首先说明了分词在中文信息处理中的作用,然后介绍了分词系统中的关键技术.提出了一种基于有向图的中文分词算法,该算法首先构造中文分词有向图,然后计算中文分词有向图中所有可能的切分路径,最后利用了最少分词原则、汉字之间的互信息和词语的频率等信息给中文分词有向图中的每条切分路径打分,分数最高的路径就对应正确的切分结果.开放测试结果表明分词精确率可达90%以上.
中文分词、有向图、中文分词有向图、切分路径、互信息
45
TP301.6(计算技术、计算机技术)
中国石油大学华东计算机与通信工程学院青年教师创新基金08120907
2009-09-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
123-125