10.3969/j.issn.1008-0821.2011.11.005
基于模糊集的Web文本最大支撑树聚类算法
当今信息社会,Internet上的信息资源杂乱繁多,用户很难准确地获得所需的信息.对此,本文提出根据特征词在html网页中的tifle、keywords、description标签的位置来计算各Web文本内容之间的相关度,对Web文档进行模糊聚类的算法,这种基于模糊集的Web文本最大支撑树聚类算法改善了文本聚类的时间和空间的复杂度,减少了文本处理的维度,提高了聚类的速度和精度,从而提高了用户对信息资源获取的方便性.
模糊聚类、Web文本、html标签、最大支撑树
31
TP274(自动化技术及设备)
湖南省科学技术情报学会学术基金项目"基于模糊聚类的网络信息资源深度挖掘与知识发现理论研究"2010203
2012-03-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
21-25