一种基于XML的非结构化数据转换方法
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中.利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息.通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大.
大数据、非结构化数据、可扩展标记语言、文档解析技术
44
TP391(计算技术、计算机技术)
湖北省统计科研计划重点项目HB131-32
2018-01-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
414-417