您的位置 首页 > 数码极客

〈如何进行千人数据的分析〉如何进行数据埋点…

组织的相关数据是一个强大的工具,内部审计人员越来越多地在工作中利用新技术进行数据分析。但是,数据的使用很容易出错,如果使用不恰当,数据分析越深入,就越可能误导决策。 以下列示了数据分析的6个启动关键点:

1.清理并标准化数据

内部审计必须了解数据收集的人员、来源和分析流程,以便充分信任产出的数据。数据的准确性、一致性以及完整性是进行数据分析的前提条件,重复的、不准确的或不相关的部分要删除掉。清理数据是为了更容易与不同的数据集结合,以获得更深入的见解。标准化数据是要确保度量单位可以通过将所有变量转换到特定范围来进行比较,这是进行有效分析的先决条件。

2.处理异常值

内部审计人员不能认为99.3%的数据显示正常就可以证明不存在问题,因为0.7%中可能存在着只有深入了解才能发现的重大风险。离群值不应该被忽略,相反,这是一个值得关注的要点。异常数据的背后可能是某些重要的事情,抓住机会去分析意料之外的事情出现的原因。

3.精确读取模式并消除干扰

数据的不稳定性或者高度变异性使得分析变得困难,不利于正确比较和预测未来。因此消除有干扰的或已经损坏的数据有利于相关设备正确处理这些数据。当前,有些模式对于大多数人来说太过复杂,不过值得庆幸的是,内置智能工具的开发如火如荼,有意义检测模式的能力也越来越强。

4.可视化数据

正如我在最近的博客文章“内部审计中有效数据可视化的五个技巧”中所写的那样,审计人员有责任简明扼要地交流审计结果,其中包括通过精心构建图表以传达最大价值。数据可视化也应该在分析过程的早期加以利用,因为它能够进行模式识别。

5.了解相关性与因果关系

相关性描述了两个变量之间的关系,而因果关系表明一个事件是另一个事件发生的结果。 当数据中存在简单的相关性时,因果关系是容易推断的,并且十分常见。由于每个人的经历、认知水平与认知结构都不同,因此每个人对于数据所展现的信息的理解程度也不一样。建议大家可以登录TylerVigen的网站Spurious Correlations,这个网站是通过有趣的方式来思考数据并查看相关性以及显示变量如何协同工作。

我个人最喜欢的是人造奶油消费与缅因州离婚率之间的关系图。

图中蓝线是缅因州千人离婚率,红线是人均人造奶油消耗量

6.合理取舍数据

越多的数据不一定越好,并非所有数据都有助于实现审计目标。你不能将数据用于一切领域,有时直觉和经验是审计某个领域的最佳工具。 此外,类似于相关性与因果关系,数据通常比它本身更具意义。谨防陷入结论最终可能不会被数据支持的危险之中。

文章来源网络;文章版权归作者所有, 部分图文源于网络,已标注作者信息,部分无法查明作者及首发来源,仅作同行学习研究之用,如涉版权,后台联系删除。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何进行千人数据的分析,如何进行数据埋点,如何进行数据收集,如何进行数据预测,如何进行数据汇总”边界阅读