10.3321/j.issn:1002-8331.2007.02.056
网上表格数据到XML的自动转换
互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询.论文利用HTML表格属性,在表格中插入冗余单元,使HTML表格规范化;对没有标志表头的HTML表格,采用格式化的信息的量化值识别网上表格的表头.在此基础上,提出了通过获取表格属性与值对应的语义层次,自动转换HTML表格数据为XML文挡的新方法.
HTML表格、信息提取、Web、XML
43
TP311.135(计算技术、计算机技术)
湖北省自然科学基金2005ABA238;国家自然科学基金60273072
2007-03-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
190-192