power query中M函数和处理数据
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了power query中M函数和处理数据相关的知识,希望对你有一定的参考价值。
参考技术A power query的M公式使用官方文档学习视频链接
调用函数:新建查询-空查询,fx=#shared,可以查看所有函数,到表中。
转换奇偶:转换-标号列-信息-偶数,显示TRUE或者FALSE,然后转换数据类型。
横向合并数据(相当于vlookup函数):选择主表,开始-合并查询,选择副表,选择匹配字段(用来连接两表的字段),连接种类(内连接,左外连接,右外连接),确定,然后选择要显示的字段。
纵向合并流程:将有相同字段名的字段纵向合并到一起,将不同字段名的字段追加在最后,非匹配的字段标记为空值。选择主表,开始-追加查询,选择副表,确定。
错误提示:找不到文件,需在步骤中退回到源的步骤,修改文件路径。
识别重复行的方法
1:使用公式countif
countif结果大于1,说明有重复值
2:排序关键字段后使用公式if
排序后,如果值等于上一个单元格,说明有重复值
3:利用数据透视表
去重方式
1:Excel数据-排序和筛选-高级-去掉重复值
2:识别重复行后删除
3:power query 开始-删除重复项
查找缺失值
1,使用CTRL+F
2,使用定位条件CTRL+G
3,利用排序筛选
处理缺失值
1,使用0替换数值类缺失值
2,使用平均值替换数值类缺失值
3,删除含有缺失值的记录或者不对此类记录进行操作
4,暂时保留缺失值行,在有必要时在进行处理
根据业务逻辑去判断,或者使用散点图查看
处理格式错误数据
转换类型:
1,设置格式:设置单元格格式
2,使用分列功能:数据-分列
3,使用公式不全信息后转换:
需要相互转换的数据类型有:文本型,日期型,数值型
1,min-max标准化:新数据=(原数据-极小值)/(极大值-极小值)
2,使用标准分进行标准化:标准分=(原始分-平均分)/标准差
标准差使用STDEV公式计算
加权平均
---纵向和横向对比,横向重要则为1,纵向重要则为0
---横向加总
----每个阶段合计值/合计总值 100%
加权平均值=变量1 变量1的权重+变量N*变量N的权重
源文件
处理流程:将数据导入power query中--处理导入的数据--合并个表信息生成完成数据信息
从日期提取年,月,季度——添加列-日期-年/季度/月
主页—将第一行用作标题
Table.SplitColumn拆分…Split…(Power Query 之 M 语言)
数据源:
一列若干行数据。
目标:
根据特定条件拆分
操作过程:
选取“品名”列》【主页】(或【转换】)》【拆分列】
选取“品名”列》【主页】(或【转换】)》【拆分列】
M公式:
= Table.SplitColumn( 表, "待拆分列", 拆分函数, "拆分列1",…, "拆分列n"或拆分列数)
扩展:
拆分表:= Table.Split( 表, 行数)
原表16行,第二参数用5,结果为4行列表,每一项包含原表的最多5行,依次排列。
拆分表: = Table.SplitAt( 表, 行数)
原表16行,第二参数用5,结果为2行列表,第一项包含原表前5行,第二项包含原表剩余行。
拆分列表:= List.Split( 列表, 行数)
拆分字符串: = Text.Split( 字符串, "分隔符")
=Text.Split("A1B2C3","2")
结果:"A1B","C3"
=Text.Split("A1B2C3","123")
结果:"A1B2C3"
拆分字符串: = Text.SplitAny( 字符串, “分隔符")
=Text.SplitAny("A1B2C3","123")
结果:"A","B","C",""
原博客各种作……所以换阵地了,不过每篇都搬过来,实在有点累,想看就自己看吧:http://blog.sina.com.cn/pureiceshadow
以上是关于power query中M函数和处理数据的主要内容,如果未能解决你的问题,请参考以下文章
Power Query和Power BI M函数中的环境和each _
Power Query (M) 使用带有 API 的函数获取信息