10.3969/j.issn.2095-2163.2011.03.015
面向互联网新闻的话题检测与追踪
为了更加准确有效地从海量的互联网网页中获取感兴趣的信息,设计并实现了一个面向互联网新闻的话题追踪与检测系统,并在该系统的基础上提出了面向海量互联网网页时话题检测中聚类算法选择策略以及一个基于多重特征的话题追踪模型,该模型能够很好地区分相似与相同的话题,并且话题追踪正确率达到了85.7%,实验结果表明文中系统能够有效地检测和追踪互联网上的话题.
话题追踪与检测、聚类算法、向量空间模型、相似度计算
1
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60736044
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
59-61,65