10.16652/j.issn.1004-373x.2017.23.030
大数据环境下的文本信息挖掘方法
文本信息挖掘有利于提高文本信息的查找和利用效率,针对传统方法存在的问题,提出文本信息挖掘方法.首先提取文本信息术语,估计信息内容与文本类别间的余弦距离,结合模糊规则推理和余弦距离得到隶属度,然后根据均值密度的中心估计方法得到文本数据集合的平均密度,确定文本信息聚类中心,删除远离文本信息聚类中心的奇异数据点,实现大数据环境下文本信息挖掘.实验结果表明,该方法能够有效提高文本信息挖掘的查准率,而且具有较强的可扩展性.
大数据、文本信息、信息挖掘、查准率
40
TN911.1-34;TP391
2017-12-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
123-126