DOI：10.3969/j.issn.1008-0821.2011.11.005

基于模糊集的Web文本最大支撑树聚类算法

引用

摘要：

当今信息社会,Internet上的信息资源杂乱繁多,用户很难准确地获得所需的信息.对此,本文提出根据特征词在html网页中的tifle、keywords、description标签的位置来计算各Web文本内容之间的相关度,对Web文档进行模糊聚类的算法,这种基于模糊集的Web文本最大支撑树聚类算法改善了文本聚类的时间和空间的复杂度,减少了文本处理的维度,提高了聚类的速度和精度,从而提高了用户对信息资源获取的方便性.

关键词：模糊聚类、Web文本、html标签、最大支撑树

所属期刊栏目：31

分类号：TP274(自动化技术及设备)

资助基金：湖南省科学技术情报学会学术基金项目"基于模糊聚类的网络信息资源深度挖掘与知识发现理论研究"2010203

在线出版日期：2012-03-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：21-25

英文信息展示

期刊专题