PowerQuery数据清洗?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PowerQuery数据清洗?相关的知识,希望对你有一定的参考价值。
在Excel中导入左侧数据后,数据列里有中文字的“亿”和“万”,求问怎么在PowerQuery中做数据清晰后,变成右侧统一单位后的数字,谢
参考技术A 一些技术实力的站长都会想要在网上抓取一些数据,而这些数据如果直接利用的话,可能会被搜索引擎认为是低质站点、也就是我们常常见到的采集站。那么为了避免搜索引擎认为站点内容的低质,清洗数据成为了一项重要的工作。以下是我的回答:
其实清洗数据就要有个专业的清洗工具,而PowerQuery就是一个专业且易用的绝佳工具,下面我们就来认识Power Query 的强大数据清洗功能。
01 提升标题
在Excel中第一行为标题行,从第二行开始才是数据,但在PQ中,从第一行开始就需要是数据记录,标题在数据之上,
因此从Excel导入数据的第一步就是要提升标题,点击「转换」的将第一行作为标题,标题提升就完成了。
点击将第一行作为标题旁边的下拉按钮,还有个将标题作为第一行,实际上就是拉低标题,这个功能也特别有用,下面会介绍到。
02 更改数据类型
更改数据类型虽然很简单,但设置正确的数据类型非常重要,后期数据建模和可视化过程中,很有可能会出现一些意想不到的错误,最后发现是数据类型设置的不对,所以一开始就养成设置数据类型的好习惯。有两种方式设置数据类型,
03 删除错误/空值
数据导入后,有可能出现错误(Error)或者空值(null),
做数据分析之前,要想达到右边的效果,需要把它们去掉,操作如下:
以上是关于PowerQuery数据清洗?的主要内容,如果未能解决你的问题,请参考以下文章
数据可视化之PowerQuery篇PowerQuery文本处理技巧:移除和提取