问题:大量数据中有一些数据是文本格式,导致数据汇总不准确。
分析:在工作中对数据进行统计分析时会出现这种情况。在工作中经常会采用Excel进行数据统计分析,会对数据的一列进行求和,但是总是会出现,求和数和人工算出的数据不一样,是什么原因呢?
结论:是由于表格在制作和写入的过程中,数据不纯导致的,而数据求和只是针对“数字”(常规等可以加减的数据都可以)格式,当数据以文本形式显示时,就不是“数字”形式,而是文本形式了,就不能进行求和计算。
举例说明:如下图所示的情况,在Excel中求和算出来的金额是8800,但是实际的金额应该是11000,导致出现偏差的原因就是发放金额中有4个人的发放金额是文本格式,不能进行加减计算。
图一
下面讲解如何解决:
首先,将这一列数据选中,选中“数据”--“分列”,会弹出如下文本框,
图二
弹出文本框之后,根据自己的需要进行选择,对于数据这种情况,没有需要分割的,就直接点击下一步,一直到结束。操作完成之后,就会全部是常规格式,常规格式就是默认格式,就会变成数据格式。如下图:
图三
这样,再次对发放金额栏进行求和,就会是正确的数据了。每次对这种大批量的数据进行操作时,就会正确的进行统计分析了。
是不是觉得超简单呢
那分列还能实现哪些常用的功能呢?
小编就工作中经常遇见的一种情况和大家分享!
用法一:可以快速截取数据中的某一段,或将一个超长文本变成几段比较短的需要的形式。
在工作中会遇到一种情况,就是需要提取一列中的数据中的前几位,比如在下面(图四)中省份一列,我们想要单独提取省份而不需要其他市、区等信息,可以用公式实现,但是如何才能更简便呢?
图四
下面通过分列功能来实现:
图五
选中需要分列的字后面,点击下一步。
图六
选择你需要的文本格式,
图七
然后选中剩下的文本再进行编辑,
图八
分成几段就依次对数据进行操作,如果不需要,就可以如图八所示,选择不导入此列。到此完成操作。
用法二,对身份证号码进行操作,把日期摘出来进行其他操作。
图九
身份证号码的第7位开始后面依次代表年月和日,倒数第二位代表性别。有时候需要通过身份证信息来提取信息,增加数据准确性和纯度。也可以采用分列法快速实现。
图十
将日期栏选出来,以日期格式,点击完成。如果要展为日期的格式,只需对其数字格式进行编辑就行了。
图十一
图十二
采用同样的方法可以将代表性别的数据筛选出来。
注意事项:
(1)在进行分列的操作中,原始数据栏要注意保存,分列出来的数据要占用当前一栏。
(2)如果一个字符串要分列出来多个字符串,那么也要相应的插入要分列成几栏的空白列,以保证后面的数据不被占用而丢失原始数据。
(3)只需要对要处理的数据选中操作即可,不必对表头等其它信息进行选中,一是分列不支持对合并的单元格进行操作,二是表头如果被选中也会进行操作,增加时间成本。
是不是超简单呢?每天一个操作小技巧,加班不存在,关注不迷路。