10.3321/j.issn:0254-4164.2003.09.011
XML文档的相似测度和结构索引研究
提出了一个可用于定量度量XML文档间差异的方法(称为XED距离).利用结点间的模拟关系,一个XML文档可以表示为一样精简的、带权重的结构索引树.两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定.利用索引树可以大大提高判定两个XML文档结构相似度的效率.XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等.
编辑距离、XED距离、结构索引树
26
TP311(计算技术、计算机技术)
国家自然科学基金60003016,60003008;国家重点基础研究发展计划973计划1998030404
2003-11-07(万方平台首次上网日期,不代表论文的发表时间)
共7页
1116-1122