10.3969/j.issn.1007-7634.2007.07.020
文本挖掘与中文文本挖掘模型研究
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程.本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状.然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向.最后提出了一个统一的中文文本挖掘模型--UCT-MF.该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架.
文本挖掘、数据挖掘、中文文本挖掘模型、中文信息处理
25
G354(情报学、情报工作)
浙江省自然科学基金M603025
2007-08-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
1046-1051