WPS Office是一款具有30多年研发历史、具有完全自主知识产权的国产办公软件。
随着近年来它对文字文档、电子表格、演示文稿、PDF文件等多种办公文档处理的功能提升,以及金山公司所打造的集成了一系列云服务提升办公效率的一站式融合办公平台,WPS Office再次获得了绝大多数用户的喜爱,成为办公人士必备的软件之一。
对于初次接触WPS Office的用户来说,要想在有效的时间内学好该软件,需要掌握一些正确的学习方法。
新手在使用WPS表格分析数据时,最常犯的错误就是直接对数据进行分析。
但从外部导入或收集的多渠道数据通常是不规范的,如有不完整的数据项,有重复的、错误的数据,数字是文本格式、数字后面有空格、有不可见的字符等。有些数据一看就是不能进行分析的,有些数据虽然不影响我们查看,但作为基础数据进行分析时就是没有价值的。
所以,拿到原始数据后,首先需要将重复的、错误的数据清洗出去,留下有价值的数据,并补充缺失的数据。
1
补齐分析必需的字段
在设计表格时,数据属性的完整性是第一考虑要素。
这是一张什么表?要记录些什么?而且,在制作初期我们还应该尽量想得多一点,将该表格将来可能涉及的分析范畴都考虑到,然后查看对应的关键字段是否缺少,如果缺少就需要添加相应的字段。
如果某条数据缺少需要分析的相应字段,就该进行处理了,要么添加该字段内容,要么直接将整条数据删除。
在整理原始数据时,有两类数据比较特殊:一类是空单元格;另一类是系统填充的默认值。
空单元格的处理技巧
WPS表格将单元格划分为两大类:空单元格和非空单元格。尤其很多函数的参数是有明确规定的。若是要求参数为非空单元格,而其中包含了空白单元格,则会影响数据分析结果。
因此,用于分析的基础表中的明细数据必须有一条记录一条,所有单元格中都应该记录有数据,每行数据都必须完整且结构整齐。即使记录的数据为空,也需要填写。
例如,在数据区域数值部分的空白单元格中输入0,在文本部分的空白单元格中输入相应的文本数据或“=”(英文输入法下的半角双引号,在WPS表格中输入空文本时,我们看到的单元格依然是空白的,只是在编辑栏中可以看到其中的内容为“=”,不过,WPS表格会认为该单元格中有数据,并将它理解为空文本)。
默认值的处理技巧
在大多数情况下,默认数据会以空白单元格显示,也有显示为“NULL”等具体数据。“NULL”等默认值一般与该字段的数据类型不同,不能进行数据分析。处理的方法主要有3种。
在这3种方法中,替换默认值是最常用的方法。
替换默认值可以用平均数替换,如一组销量数据有默认值或者显示为默认值时,可以用平均销量来进行替换;
替换默认值也可以用回归分析后的数据模型来替换,如连续时间段内的销量数据有默认值或显示为默认值时,通过数据预测回归分析法计算出默认值进行替换;
替换默认值还可以先检查为什么这里是默认值,然后找到正确的数据进行替换,如员工的工龄数据默认时,就可以通过查询企业人事资料将正确的值补上。
删除默认值是指删除包含默认值的一组数据,样本数据充足时可以这样做。如果样本数据量很大,也可以选择忽略默认值。
当表格中记录的数据量很大时,一个一个处理空单元格和默认值是比较难的。可以利用查找和定位功能进行快速定位,如果是要寻找确定的默认值,就直接使用查找功能即可。如果是要找出缺失数据,就用定位功能快速定位到空白单元格。
例如,要用平均值替换空白单元格,可以先计算出表格数据的平均值,然后按【Ctrl+G】组合键打开【定位】对话框,选中【空值】单选按钮,单击【定位】按钮。
这样,表格中所有是空值的单元格都会被查找出来。保持空值选中状态,输入平均值。
按【Ctrl+Enter】组合键,即可在所有选中的空值单元格中批量填充平均值。
2
合并单元格处理技巧
我们平时制作的一些展示性表格,为了美观,或者减少数据输入的工作量,会对一些连续的多个具有相同内容的单元格进行合并,但是用于分析的数据却不能随便合并单元格,否则排序、透视表等功能将无法顺利使用。
面对存在单元格合并的表格,需要取消单元格合并。WPS表格中提供了多种单元格合并和拆分功能,可以先看看能不能智能拆分,如果不能就结合定位、填充等功能进行调整。
例如,上个案例中第一列的合并单元格可以用“拆分并填充内容”的方式进行拆分。
D列中的合并单元格因为是用公式进行的计算,所以只能将计算结果转换为数值,然后用“拆分并填充内容”的方式进行拆分;或者先用“取消合并单元格”。
然后定位所有空值,根据第一个空值要输入的数据规律,输入公式“=D2”。
最后按【Ctrl+Enter】组合键,就能让所有选中的空白单元格都填充上相应的内容。
不过,这里对不同城市的销量汇总完全可以不要,后期可以通过WPS表格的“分类汇总”或“透视表”功能来实现,因此这列数据可以删除。
晋ICP备17002471号-6