期刊专题

10.11925/infotech.2096-3467.2018.0757

基于多因素特征选择与AFOA/K-means的新闻热点发现方法

引用
[目的]研究新闻文本的特征降维方法及聚类算法,以期进一步提升热点话题发现效率及准确率.[方法]基于传统TF-IDF特征权重计算方法,引入符号、词性、位置及长度4个特征加权,实现多因素特征选择.从编码方式、适应度函数、自适应步长及群体适应度方差这4方面构造改进果蝇优化算法(Ameliorated Fruit Fly Optimization Algorithm,AFOA),利用AFOA优选K-means初始聚类中心,实现优化后的K-means热点话题发现.采用多因素特征选择识别热点话题,利用TOPSIS获得热点话题排名.[结果]相关实验表明,多因素特征选择及AFOA/K-means算法分别显著提高了聚类效果,验证了所提方法整体有效性.[局限]仅适用于中文新闻文本.[结论]本文方法能够为中文新闻热点发现方法研究提供一条新思路.

网络新闻、热点话题发现、多因素特征选择、AFOA/K-means算法、TOPSIS模型

3

G250(图书馆学、图书馆事业)

辽宁省社会科学规划基金项目“辽宁新型城镇化评价指标体系研究”项目L14BTJ004的研究成果之一

2019-07-10(万方平台首次上网日期,不代表论文的发表时间)

共10页

97-106

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

3

2019,3(4)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn