PowerQuery数据清洗?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PowerQuery数据清洗?相关的知识,希望对你有一定的参考价值。

在Excel中导入左侧数据后,数据列里有中文字的“亿”和“万”,求问怎么在PowerQuery中做数据清晰后,变成右侧统一单位后的数字,谢

参考技术A 一些技术实力的站长都会想要在网上抓取一些数据,而这些数据如果直接利用的话,可能会被搜索引擎认为是低质站点、也就是我们常常见到的采集站。那么为了避免搜索引擎认为站点内容的低质,清洗数据成为了一项重要的工作。
以下是我的回答:

其实清洗数据就要有个专业的清洗工具,而PowerQuery就是一个专业且易用的绝佳工具,下面我们就来认识Power Query 的强大数据清洗功能。

01 提升标题

在Excel中第一行为标题行,从第二行开始才是数据,但在PQ中,从第一行开始就需要是数据记录,标题在数据之上,

因此从Excel导入数据的第一步就是要提升标题,点击「转换」的将第一行作为标题,标题提升就完成了。

点击将第一行作为标题旁边的下拉按钮,还有个将标题作为第一行,实际上就是拉低标题,这个功能也特别有用,下面会介绍到。

02 更改数据类型

更改数据类型虽然很简单,但设置正确的数据类型非常重要,后期数据建模和可视化过程中,很有可能会出现一些意想不到的错误,最后发现是数据类型设置的不对,所以一开始就养成设置数据类型的好习惯。有两种方式设置数据类型,

03 删除错误/空值

数据导入后,有可能出现错误(Error)或者空值(null),

做数据分析之前,要想达到右边的效果,需要把它们去掉,操作如下:

以上是关于PowerQuery数据清洗?的主要内容,如果未能解决你的问题,请参考以下文章

[PowerQuery] PowerQuery各个组件功能

[PowerQuery] PowerQuery各个组件功能

[PowerQuery] PowerQuery各个组件功能

数据可视化之PowerQuery篇PowerQuery文本处理技巧:移除和提取

数据可视化之PowerQuery篇PowerQuery文本处理技巧:移除和提取

如何通过power+query将10列数据各乘1000?