10.3969/j.issn.1002-137X.2010.03.038
基于语义支持的Deep Web数据抽取
在分析DeepWeb查询实现机制的基础上,给出了在语义本体的支持下,通过机器学习来实现自动填充查询接口,以实现自动数据抽取的算法:构造二维表,表的列为通过Deepweb查询接口页面提取到的各个控件,通过为各控件赋值的方式来为表中添加相应的元组,根据返回结果的情况,即数据抽取成功或抽取失败,作为指导进行分类学习,最终依照学习的结果来自动构造请求字符串完成数据的抽取.实验表明算法具有较好的效果.
数据抽取、语义、机器学习、深网
37
TP391(计算技术、计算机技术)
2010-05-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
156-158,174