面向海量低质手机轨迹数据的重要位置发现
重要位置是指人们在日常生活中的主要活动地点,比如居住地和工作地.智能手机的不断发展与普及为人们的日常生活带来了极大的便利.除了通话、上网等传统应用之外,手机连接基站自动生成的日志记录也是用于用户行为模式挖掘的重要数据来源,例如重要位置发现.然而,相关工作面临着诸多挑战,包括轨迹数据规模庞大、位置精度低以及手机用户的多样性.为此,提出了一个通用解决框架以提高轨迹数据可用性.该框架包含一个基于状态的过滤模块,提高了数据的可用性,以及一个重要位置挖掘模块.基于此框架设计了两种分布式挖掘算法:GPMA(grid-based parallel mining algorithm)和SPMA(station-based parallel mining algorithm).进一步地,为提高挖掘结果的准确性和精确度,从3个方面进行优化:(1)使用多元数据的融合技术,提高结果的准确性;(2)提出了无工作地人群的发现算法;(3)提出了夜间工作人群的发现算法.理论分析和实验结果表明,所提算法具有较高的执行效率和可扩展性,并具有更高的精度.
低质、轨迹挖掘、重要位置、数据修正
27
TP311(计算技术、计算机技术)
国家重点基础研究发展计划9732012CB316203;国家自然科学基金61370101,U1501252,61532021;上海市教委科研创新重点项目14ZZ045;National Basic Research Program of China 9732012CB316203;National Natural Science Foundation of China61370101,U1501252,61532021;Innovation Program of Shanghai Municipal Education Commission14ZZ045
2016-12-13(万方平台首次上网日期,不代表论文的发表时间)
共15页
1700-1714