DOI：10.3969/j.issn.1007-7634.2007.07.020

文本挖掘与中文文本挖掘模型研究

引用

摘要：

文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程.本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状.然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向.最后提出了一个统一的中文文本挖掘模型--UCT-MF.该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架.

关键词：文本挖掘、数据挖掘、中文文本挖掘模型、中文信息处理

所属期刊栏目：25

分类号：G354(情报学、情报工作)

资助基金：浙江省自然科学基金M603025

在线出版日期：2007-08-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1046-1051

英文信息展示

期刊专题