支持大规模互联网新闻舆情数据ETL过程设计
近年来,网络技术的蓬勃发展引发了互联网数据的爆炸式增长,以新闻站点、微博等为代表的网络媒体时时刻刻在产生大量不规则、异构的新闻舆情数据.该文在分析互联网新闻舆情数据特点的基础上,提出了支持大规模互联网新闻舆情数据ETL过程的解决方案,实现对多源、非结构化的新闻舆情数据的格式化存储.
新闻舆情数据、ETL过程
15
TP3(计算技术、计算机技术)
嘉兴学院SRT项目SRT2018B047;国家级大学生创新创业训练计划项目201810354029
2019-04-08(万方平台首次上网日期,不代表论文的发表时间)
共2页
11-12