10.3969/j.issn.1009-2374.2008.13.090
基于串频统计和词形匹配的分词系统
中文分词是中文文本挖掘的重要环节.中文分词的方法主要有基于辞典与规则和基于统计两种,"基于串频统计和词彤匹配的分词系统"在一定程度上结合了中文分词两种方法的优点于一体,它克分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的.
中文分词、汉字短串、串频统计
TP391.1;TP181;G21
2008-09-01(万方平台首次上网日期,不代表论文的发表时间)
共2页
111-112