10.3778/j.issn.1002-8331.1905-0068
面向类不平衡问题的"职业举报人"识别方法
"职业举报人"团伙化、规模化、专业化、低龄化作案趋势日趋明显,政府部门对其识别大多采用人工鉴别的方法,造成了大量人力资源的浪费.采用Bootstrapping数据重采样技术,结合文本、时间和举报人属性等特征,在解决类不平衡数据的过拟合问题基础上,实现了"职业举报人"的准确识别.实验结果表明,相比过采样和欠采样技术而言,利用Bootstrapping重采样技术识别准确率更高,采用CFS方法结合BestFirst策略对数据特征进行优化,在保证精度的前提下能够实现更高的计算效率.以全国12358价格监管平台的真实数据为驱动,验证了方法的有效性,对比分析了"职业举报人"和正常消费者的投诉举报行为习惯差异.
职业举报人、类不平衡、特征选择、数据驱动、12358价格监管平台
55
TP181(自动化基础理论)
国家社科基金青年项目18CSH018
2019-08-01(万方平台首次上网日期,不代表论文的发表时间)
共8页
1-7,23