面向第三方支付平台非结构化大数据分布特征的融合聚类算法
对于蓬勃发展的第三方支付平台,挖掘非结构化数据中蕴含的分布信息有助于平台对商户精准细分.为充分挖掘多元交易分布信息,本文提出针对多元分布样本的商户聚类算法.本文首先采用高斯混合模型拟合交易分布,进而基于Wasserstein距离提出多元分布间的距离定义,并设计迭代算法实现商户聚类.在此基础上,本文进一步提出融合多元分布与协变量特征的聚类算法,得到更综合稳健的聚类效果.本文分别在模拟数据和某第三方支付平台真实商户交易数据上进行验证,结果表明本文算法相较于其他对比方法具有更准确的聚类表现,并且通过聚类结果还能从分布、协变量特征等角度直观反映异常套现商户的行为模式,为第三方支付平台进行风险识别、个性化管理等提供决策支持.此方法可广泛应用于需要融合多维度数据分析的客群聚类场景.
客户细分、高斯混合模型、Wasserstein距离、聚类分析、非结构化数据
2
O212(概率论与数理统计)
国家自然科学基金;对外经济贸易大学中央高校基本科研业务费专项资金资助项目
2023-10-19(万方平台首次上网日期,不代表论文的发表时间)
共30页
179-208