基于关系图谱的科技数据分析算法
随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据.对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务.由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理.首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务.实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右.
关系图谱、数据分析、图谱构建、人员关系图谱、数据挖掘、服务应用
48
TP391(计算技术、计算机技术)
国家重点研发计划课题2019YFB1405103
2021-03-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
174-179