10.3778/j.issn.1002-8331.1407-0552
基于特征偏好的XML文档聚类算法
XML文档聚类在众多数据应用领域都具有重要作用。基于特征偏好的XML文档聚类算法是对XML文档进行特征选择,将XML文档描述为n维特征向量,再结合CFP(Clustering with Feature order Preference)算法,根据特征偏好为其赋予权重,每次迭代聚类过程中进行权重的更新。实验结果表明当CFP算法中的特征偏好权重和XML文档向量化时所用的层次权重设定相结合时,可弥补XML文档向量化时的弊端,提高了XML文档聚类的精度。
可扩展标记语言(XML)文档聚类、层次权重、特征偏好
52
TP391(计算技术、计算机技术)
国家自然科学基金No.61202350。
2016-07-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
64-68