利用sqlserver自带功能开展数据挖掘的审计方法 |
发布日期:2016-12-19 来源:常州市审计局 |
在大数据时代临近的今天,数据挖掘作为数据审计方法越来越被审计人员所重视。实际上除了专用数据挖掘工具外,在sqlserver中已经集成了部分数据挖掘功能。近日,审计人员在某医院信息系统审计中充分利用该功能辅助审计分析,取得了良好效果。
一、运用聚类分析技术确定审计重点
适用范围:在审计过程中,聚类分析技术适用于对信息系统中被审计单位的同类型的财务数据或者业务数据进行分组,使其成为有相似特性的聚集。一般说来,财务数据及重要业务数据的变动具有一定的规律性。所以如果某些数据处于稀疏区域,说明其变动表现异常,需要重点关注。同时通过观察该区域记录的特征,可以发现审计需要查证的问题特征。
案例:审计人员在对该院门诊处方开药合规性审查的过程中,运用了聚类分析技术。根据《处方管理办法》第十九条的规定 “处方一般不得超过7日用量;急诊处方一般不得超过3日用量”。因此,审计人员需要在海量的门诊处方数据中锁定开药数量异常的处方进行重点审查,同时需分析哪类药品违规开药情况居多。要达到这个审计目标,进行常规审计肯定既费时又费力,但是利用聚类分析可以轻松简单实现。
审计步骤:
1.首先从门诊处方明细库中筛选出单张处方单种药品开药数量大于10的记录(假定10以下的开药记录为正常),生成门诊开药明细表1。
2.运行SQL Server Business Intelligence Development Studio 程序,新建Analysis Service 项目。
3.在解决方案资源管理器窗口,依次新建数据源,数据源试图,挖掘结构。建立挖掘结构时,先选择聚类分析数据挖掘技术,再选择门诊开药明细表1为输入表,然后设定键和输入字段。
4.模型定义完成后,点击挖掘模型查看器,就可看到挖掘模型。先分析“分类剖面图”,对门诊开药数量和药品名称进行分类,从图中可以很直观看出稀疏区域位于分类10。下面点击“分类对比”,选择分类10与非分类10作对比。
审计结论:图表显示分类10的记录都是集中在药品数量在43~200区间,药品主要为开塞露、庆大霉素、口服葡萄糖、硫软膏等。审计人员将该挖掘结果作为审计重点,对上述药品开药数量在43以上的记录进行详查,确定该院存在对部分药品超剂量开药的违规问题。
二、运用关联分析技术揭示关键属性
适用范围:关联分析技术适用于查找、分析同类或不同类会计科目及数据项之间可能存在的某种对应关系。通过抽丝剥茧,挖掘出数据的各个属性间可能的相互影响,发现一些隐藏的经济活动,为后续审计工作提供参考。
案例:审计组在对住院病人费用审计的过程中,运用关联分析技术试图寻找影响其费用形成的关键因素。
审计步骤:
1.从住院病人费用等表中选取字段名为年龄、诊断结果、住院天数、住院病区、药品费用、住院总金额的病人记录,生成住院情况分析表
2.然后运行SQL Server Business Intelligence Development Studio,选择决策树挖掘模型,定义输入列和可预测列。
3.模型定义完成后,点击“挖掘模型查器”,选择“依赖关系网络”就可看到各属性与住院总金额间的依赖关系。通过拉动强链接,得出挖掘结果,原来是药品费用和住院天数决定了病人的住院总费用。
审计结论:审计人员将重点锁定于对上述两项关键属性的审查,最终发现该院存在违规设置住院天数计算规则以及超标准药品加价的问题。(常州市审计局 周建东)
|
主办单位:常州市审计局
地址:龙城大道1280号1号楼B座12楼
电话:0519-85682658 网站地图
技术支持电话:0519-85685023(工作日9:00-17:00)
网站支持IPV6 推荐使用1024*768或以上分辨率,并使用IE9.0或以上版本浏览器