澎湃Logo
下载客户端

登录

  • +1

浅析数据挖掘技术在审计中的运用

2021-10-21 16:34
来源:澎湃新闻·澎湃号·媒体
字号

浅析数据挖掘技术在审计中的运用 原创 罗参 审计观察

随着信息技术的迅猛发展,各个领域都积累了海量的、不同形式存储的数据资料,这些海量数据中往往隐含着各种各样有用的信息,仅仅依靠简单的数据库查询检索和基础统计方法很难获得更深层次的信息,数据挖掘技术应运而生。

一、什么是数据挖掘技术

数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,简称:KDD),是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。简单来说就是从大量数据源中,自动地或方便地提取那个我们想要寻找到结果的模式。

二、数据挖掘技术在审计中的重要作用

数据挖掘技术作为信息技术的一种特有的技术手段应用在审计领域,是传统审计方法无法取代的。通过数据挖掘技术可以从被审计单位错综复杂的业务环境和海量的数据中,在极短的时间里进行数据分析,协助审计人员更加高效发现异常信息,在一定程度上较低了审计风险,从而大大提高了审计效率,更加有效地节省人力资源成本。数据挖掘技术通过对数据的全面的、深层次的、系统的分析,能够有效消除抽样审计风险,达到审计的全覆盖。

三、存在的优势与面对的困难

(一)存在的优势

一是随着审计环境的变化,传统的很多审计技术和方法显得效率低下和无法实施,大数据审计已经成为审计的主要趋势,只有用好数据挖掘技术才能够从根本上解决这个问题。二是数据挖掘对数据预测的能力是审计人员发现审计问题的主要手段。利用数据挖掘技术可以使审计人员获得审计决策优势和审计技术优势,可变被动审计为主导审计,对审计发展意义重大。三是数据挖掘技术通过对数据的深层次分析,生成审计疑点,有效扩大审计范围和增加审计深度,提高审计质量和效率,降低审计风险。

(二)面对的困难

一是被审计单位的数据质量问题。数据挖掘技术的应用高度依赖数据本身的质量,如果被审计对象中的数据质量不高,或者存在虚假数据,那么再先进的挖掘技术也无法得出有意义的结论。二是对人员素质要求较高。随着多元化审计发展趋势,大数据的应用需要知识复合、能力复合、思维复合的审计人员,而目前审计队伍对数据仓库、数据采集和数据挖掘等技术掌握的人才严重缺乏。

四、使用数据挖掘技术的常用方法路径

在数据库中,利用数据挖掘技术,不但可以完善、丰富数据库应用,还能为用户决策提供数据支持。常用的数据挖掘技术有:统计分析、关联分析、聚类分析、预测分析、离群点检测等。

(一)统计分析

统计分析法指通过对研究对象的规模、速度、范围、程度等数量关系的分析研究,认识和揭示事物间的相互关系、变化规律和发展趋势,借以达到对事物的正确解释和预测的一种研究方法。主要是利用统计学和概率论的原理,构建模型,并用数据来验证预想的架设是否与模型分析结果匹配。例如在“一卡通”惠农补贴专项审计中,通过对补贴领取的次数、金额、面积等要素的模型构建,运用统计分析技术发现部分金额大、面积大、领取次数多的情况,经过审计调查、取证发现存在虚报冒领、重复领取等现象。

(二)关联分析

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。简单来说就是从不同数据集中挖掘发现物品间的隐含关系。

利用关联分析,审计人员可以通过关联规则挖掘技术对不同数据进行关联分析,找出各数据之间的相互联系,发现某些数据的异常联系,以此为基础,寻找审计线索,发现审计疑点。例如在近几年的扶贫资金审计中,通过对扶贫、房产、工商、车辆、税收、公积金、社保、就业等多种数据的关联分析,揭露精准扶贫人员准确性以及扶贫资金发放精准性。发现超范围享受扶贫政策(包括财政供养人员、有房产登记信息人员、村组干部、非建档立卡贫困人员)等一系列疑点,针对金额大、出现频率高的疑点问题,逐一延伸调查量大、出现频率高的疑点问题,逐一延伸调查相关单位、乡镇、农户,核实排查真实情况,确保“精准扶贫”落到实处。

(三)聚类分析

聚类分析是研究如何将对象按照多个方面的特征综合分类的一种统计方法。就是把相关或者类似的数据对象集合到一起,常常用在数据探索阶段,其任务是把一组未明确分类的数据,根据一些相似性规则把数据按相似特征归成若干类, 类似于人们常说的物以类聚。它的基本要求是属于同一个类别的数据之间的相似性尽可能大,而不同类别数据之间的相似性尽可能小,从而发现数据的分布模式和数据属性间的规律,找出对全体数据的描述。可以不受审计人员 “有限的”经验知识约束,不受个人主观意识的干扰,不必事先给定一个分类标准,系统会依据聚类分析算法,按照分析出的数据特征,自动确定分类依据,进行自动分类。

实际应用中,我们可以通过将当年数据财务与往年数据比较,可根据数据规则,如:资金拨付去向、项目大小、项目类型、项目地址等等。将资金的使用情况进行分组,使资金用途具有最大的相似性,各组之间尽可能的具有最大的相异性,从而产生分类标准(即:聚类标准),按照标准对资金进行分析,确定资金使用的总体特征,为审计目标和审计重点建立依据。

(四)预测分析

预测分析是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。简单来说就是找出历史数据之间的变化规律,建立相应的模型,该模型允许人们根据已知的属性值来预测其他某个未知的属性值。可以获得当前数据的未来变化趋势,所具有的属性值的范围、种类和特征等。如在销售收入的分析性复核时,审计人员通过销售收入的历史资料,可以确定若干与销售收入相关联的解释变量,建立揭示销售收入与各解释变量之间依赖关系的分析模型,从而对公司被审计年度的销售收入做出合理的预测。得出数据与财务数据结构进行对比分析,进一步判断财务数据的真实性和完整性。(作者单位:四川省广元市旺苍县审计局)

原标题:《浅析数据挖掘技术在审计中的运用》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈