10.3969/j.issn.1000-2324.2019.05.033
基于改进EMD距离的信息特征单元的聚类方法
为研究基于改进EMD距离的信息特征单元聚类方法,本文利用向量空间方法提取信息特征单元,设置EMD地面距离作为不同信息特征单元间的距离,将信息特征单元比作供货商与消费商.为避免利用EMD距离聚类引起的信息特征单元过分割、正例现象增多以及供货商无法供货问题,设置符合特征相似条件的供货商增大权值的相似阈值,利用阈值令运输以低成本的供货商为主,改进EMD距离;利用改进EMD距离算法实现信息特征单元的有效聚类.经仿真平台验证,该方法对文本、股票等不同类型信息特征单元聚类精度达到99%以上,并且聚类过程迭代次数少,聚类性能优.
EMD距离、信息特征单元、聚类方法
50
TP391(计算技术、计算机技术)
广西教育厅科研项目:基于文本聚类的东盟跨语言查询扩展模型及算法研究2019KY1678
2019-11-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
885-888,920