面向NoSQL数据库的JSON文档异常检测与语义消歧模型
随着信息化技术的发展,面对材料等相关领域数据的多源异构、扩展性强、爆炸增长等特点,传统关系数据库无法对数据进行存储,因此可利用NoSQL的无模式存储、高扩展性等特性来解决这一难题.作为NoSQL数据库常用的数据存储格式,JSON因简单性和灵活性备受欢迎.然而,NoSQL数据库缺乏模式信息,在JSON文档存入数据库之前,需要对其进行数据验证与分析.目前,大多数方法是基于JSON schema对JSON文档格式的规范性进行校验,无法有效解决JSON文档的异常检测以及语义歧义问题.为此,文中提出了面向NoSQL数据库的JSON文档异常检测与语义消歧模型doctorJSON.该模型基于JSON schema对存入的JSON文档分别设计了异常检测算法deoutJSON和语义消歧算法disemaJSON,以检测JSON文档存在的异常和歧义.在真实数据集与合成数据集上的实验验证了所提模型的有效性和执行效率.
NoSQL数据库、JSON schema、JSON文档、异常检测、语义消歧
48
TP311(计算技术、计算机技术)
国家自然科学基金61972268
2021-03-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
93-99