软件开发活动数据集的层次化、多版本化方法
随着开源软件的兴起及软件开发支撑工具的普及,Internet上积累了大量开放的软件开发活动数据,越来越多的实践者与研究者尝试从中获取提高软件开发效率和产品质量的洞察.为了提高数据分析的效率、方便分析结果的重现与对比,许多工作提出了构建与使用共享数据集.然而,现有软件开发活动数据集的构建过程可追溯性差、适用范围窄,对数据随时间、环境发生的变化欠考虑.这些不足直接威胁数据的质量及分析结果的有效性.针对该问题,提出一种层次化、多版本化的方法来构建与使用软件开发活动数据集.层次化是指在数据集中包括收集和后续处理所得的原始、中间和最终数据,建立数据集的可追溯性并扩展其适用范围.多版本化是指通过多种方式进行多次数…展开v
数据驱动的软件工程、软件开发活动数据、数据分析、数据质量、数据集
30
TP311(计算技术、计算机技术)
国家重点研发计划2018YFB1004201;国家自然科学基金61432001,61825201
2019-08-13(万方平台首次上网日期,不代表论文的发表时间)
共15页
2109-2123