10.11925/infotech.2096-3467.2021.1116
基于多任务学习的税务稽查选案研究
[目的]整合多源涉税数据信息,利用机器学习方法,实现对重点税种涉税违法企业的智能判别分析.[方法]利用网络数据获取、文本挖掘等技术,收集企业财务指标、高管信息、媒体关注信息等多源涉税数据进行融合处理;利用随机森林方法进行特征选择,构建税务稽查选案判别指标体系;利用改进的基于焦点损失函数的多任务结构化稀疏学习方法,视不同税种选案工作为不同任务联合训练,构建了分税种的税务稽查选案判别模型.[结果]真实数据实验结果表明,所提出的基于多任务学习方法构建的税务稽查选案判别模型具有较好的泛化性能和应用能力,其召回率均值达到0.830 9,相对于逻辑回归方法和传统的多任务结构化稀疏学习分别提升了 0.135 1和0.103 3.[局限]模型需要在上市企业以外的数据集层面进一步验证.[结论]本研究所构建的模型能够更加精准地甄别出不诚实纳税的目标企业,且可同时识别出其具体涉及的偷漏税税种,为政府智慧税务稽查提供新思路.
多源数据融合、智慧税务稽查、多任务结构化稀疏学习、焦点损失函数
6
F812(财政、国家财政)
国家社会科学基金19BTJ023
2022-10-08(万方平台首次上网日期,不代表论文的发表时间)
共12页
128-139