期刊专题

10.3772/j.issn.1002-0470.2010.07.010

使用"分裂-合并"策略改进文本聚类集成算法的研究

引用
探讨了"分裂-合并"(DM)策略对文本聚类集成算法改进的效果.首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随后在聚类集成阶段采用两个快速的谱聚类算法进行集成.在6组真实文本集上进行了实验,使用DM策略的两个聚类集成算法获得的平均标准化互信息(NMI)分别比改进前的算法提高了4 6和7 9个百分点,证明了DM策略可以有效提高文本聚类集成算法的聚类质量.

聚类集成、谱聚类、文本聚类、分裂-合并(DM)、标准化互信息(NMI)

20

TP3;TP1

863计划2007AA01Z172;国家自然科学基金60975042,60603092;高等学校博士学科点专项科研基金20070217043

2010-09-10(万方平台首次上网日期,不代表论文的发表时间)

共5页

714-718

相关文献
评论
暂无封面信息
查看本期封面目录

高技术通讯

1002-0470

11-2770/N

20

2010,20(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn