10.3321/j.issn:1002-8331.2006.27.049
半结构化数据的模式抽取
模式抽取在半结构化数据研究领域中具有重要意义.论文结合同类对象集和标签路径的概念,提出了一种从OEM模型中抽取模式的新方法.算法的基本思想是:在用OEM模型表示的半结构化数据中查找同类对象集,并通过构造模式表的方法来实现模式抽取.这种方法不但能从层次结构数据中抽取模式,而且还能从包含环路的OEM数据中进行模式抽取,克服了其它一些算法不能从带有环路的数据中进行模式抽取的缺点.
半结构化数据、OEM、同类对象、模式表、模式抽取
42
TP311(计算技术、计算机技术)
2006-10-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
162-165