基于Synonyms、k-means的短文本聚类算法
当今社会,网络搜索成为人们获取资讯的主流.短文本因特征信息不足且高维稀疏等特点,导致传统文本聚类算法应用于短文本聚类时效率低下.为此,我们采用为关键词以及k-means和synonyms相结合的方法,提高主题归类精确度.实验证明,我们提出的s-k(Synonyms-k-means)主题聚类算法不仅有效归类主题,而且能挖掘出词语的潜在含义.
文本聚类、短文本、k-means、synonyms
15
TP301(计算技术、计算机技术)
北京市级项目——网络短文本流快速聚类算法研究,项目编号201810011068
2019-04-17(万方平台首次上网日期,不代表论文的发表时间)
共2页
5-6