10.3969/j.issn.1002-1965.2005.02.001
汉语自动分词新思维:无词典切分
汉语自动分词与中华民族文化复兴紧密相联,但汉语自动分词又是目前中文信息处理中的难题.通过分析现有汉语词自动分词方法及其局限性、汉语词自动分词中存在的困难、汉语同西方语言和日语的差别,认为传统汉语文本具有不可自动切分性,从汉语自动分词的成本、影响和汉语言发展的前途出发,必须对传统汉语文本进行改革.提出了一种新的自动分词思维:"无词典切分",即改变汉语书写习惯,在汉语文本生成时在汉语词之间增加分隔信息,使汉语适于计算机自动处理.
汉语词切分、自动分词、无词典切分、中文信息处理
24
G2(信息与知识传播)
国家人文社会科学基金02JAZJD870003
2005-03-24(万方平台首次上网日期,不代表论文的发表时间)
共3页
2-4