10.3969/j.issn.1672-6375.2011.06.008
面向藏文WEB的话题发现系统的设计
针对互联网上新闻网站和论坛、博客等发布的海量自然语言文本,本文设计了一个面向藏文的话题发现系统,将大量藏语文本分类整理并聚合成各个话题。本文采用两层聚类策略对文本进行聚类,实验结果表明文本聚类取得了不错的结果,具有较高的应用价值。
话题发现、凝聚聚类、Single—pass聚类、热度计算
40
TP274(自动化技术及设备)
国家支撑项目,项目2009BAH41B00
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
17-19