期刊专题

基于Hive的海量公交客流起讫点挖掘方法

引用
目前起讫点(origin-destination,OD)挖掘方法普遍存在无法并行分析多条线路、低效率、预测率不足的问题.考虑到Hive在海量数据上的查询性能优势,基于Hive实现了OD挖掘,克服了上述问题.基于时间阈值匹配上车站点,失配记录基于站点上客数再次匹配.基于表连接的出行链算法预测下车站点,预测失败的记录基于概率进行两次预测.以石家庄2018年1月1日—2018年3月27日的IC卡刷卡数据和调度数据进行OD挖掘,在清洗后的11312505条出行记录中挖掘出11270037条OD记录,预测率达到99.6%,出行与吸引校验质量较高,Hive并行调优开启后耗时17829.04 s.可见该方法满足生产环境中离线挖掘OD的业务需求.

客流、起讫点(OD)、下车站点、Hive

20

TP391.9(计算技术、计算机技术)

天津市科技计划;天津市自然科学基金

2020-08-11(万方平台首次上网日期,不代表论文的发表时间)

共10页

8300-8309

相关文献
评论
暂无封面信息
查看本期封面目录

科学技术与工程

1671-1815

11-4688/T

20

2020,20(20)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn