基于迭代式聚类的审计疑点发现——以上市公司财报数据为例

引用

摘要：

数据库查询技术作为目前计算机审计的主要方法,是一种通过审计人员先验知识发现审计疑点的方法.但当缺乏相关审计知识时,便难以给出从海量数据中发现疑点的方法.为破解这一难题,提出基于迭代式聚类的审计疑点发现方法.该方法可在无先验知识的情形下,通过对审计指标的分析,将与大多数被审计对象行为明显相异的少数对象自主识别为审计疑点.利用多种非结构化信息及网络爬取技术,从140份审计报告中自动提取出高频审计问题并据此选定财务指标;归集2008-2012年913家上市公司的财报数据,应用迭代式聚类方法,挖掘出68家疑点公司进行分析.并利用证监会等机构的非结构化网络信息,验证了此方法的有效性.验证结果表明:迭代式聚类方法有助于从海量数据中自主发现审计疑点,缩小疑点筛查范围,提高审计效率.

关键词：计算机审计、聚类、审计疑点、海量数据

资助基金：本研究受到国家科技支撑计划项目项目批准号:2012BAH08B02、国家自然科学基金项目项目批准号:71272216、教育部人文社会科学研究项目批准号:13YJCZH143联合资助.

在线出版日期：2015-10-10（万方平台首次上网日期，不代表论文的发表时间）

页码：60-66

英文信息展示

期刊专题