Power Query中数据分割函数详解(3)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Power Query中数据分割函数详解(3)相关的知识,希望对你有一定的参考价值。

参考技术A Table.SplitColumn (table as table , sourceColumn as text ,splitter as function , optional columnNamesOrNumber as any , optional default as any , optional extraColumns as any ) as table

参数1代表需要操作的表;参数2代表需要分割的文本字段,是一个文本格式;参数3是分割操作的函数,可用的分割函数有9个;参数4是拆分后生成的列数或者字段名称的列表;参数5是用于替换拆分后为空值的值;参数6是展开后的类型,可以为列表。

参数3的操作函数主要有以下几个。

1.     Splitter.SplitTextByRanges

Splitter.SplitTextByRanges (ranges as  list ,  optional srartAtEnd as  nullablelogical ) as  function

返回根据指定偏移量和长度将文本拆分为文本列表的函数。第1参数为偏移的列表;第2参数为是做起始和结束的判断,默认是false。 请注意第1参数实则为列表嵌套格式,也就是偏移量,提取字符数,偏移量,提取字符数,此外此函数可以重复提取,针对既想保留原字符又想做拆分的话会比较便捷。

例:

Table.SplitColumn(源,"学科",Splitter.SplitTextByRanges(0,10,0,4))=    

解释:第1个列表内因为是从0位置提取,也就是从最左边提取,首先提取10个字符作为第1个拆分字段,因为原本的字符数小于10,相当于保留原字符格式。第2个列表是从0开始提取4个字符,也就是从最初位置提取4个字符。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRanges(1,2,0,4,true))=

解释:因为第2参数是true(默认是false),如果是true,则列表的提取顺序反过来,也就是从尾开始先按0,4列表提取,"新概念基础英语"的最后开始提取4位;然后在按1,2列表提取,"新概念基础英语"从尾部第1位置提取2位也就是"础英"2个字符。

2.     Splitter.SplitTextByRepeatedLengths

Splitter.SplitTextByRepeatedLengths (length as  number ,  optional stratAtEnd as  nullablelogical ) as  function

按指定长度后反复将文本拆分为文本列表的函数。第1参数是文本长度;第2参数是起始和结束的判断。 可以理解为按固定的字符数来拆分 。可以为空值代表不拆封保留原值,如果为0则代表拆分后的结果为空文本。如果最后拆分的字符不满足固定字符数,则会省略。还有个细节要注意,拆分后生成的字段以第一个数据为基础。

例:

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(1))=

释:指定固定1个字符数来拆分文本。因为第1个字符是4个字符,所以按1个字符拆分的话,拆分结果是4个字段。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(2))=

释:指定固定2个字符数来拆分文本。因为第1个字符是4个字符,所以按2个字符拆分的话,拆分结果是2个字段。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(3,true))=

解释:因为第2参数是true,所以是从后往前进行拆分,也就是先提取最后3个字符,然后依次往前提取剩余的,同时因为第1个拆分文本"高等数学"是4个字符,所以按3个字符拆分后只会生成2个字段,往前推剩余的也就是"高"这1个字符。我们可以把字段加出来就可以更加的理解了。

3.     Splitter.SplitTextByWhitespace

Splitter.SplitTextByWhitespace ( optional  quoteStyle as  nullableQuoteStyle.Type ) as  function

返回按空白处将文本拆分成文本列表的函数。只有1个参数为可选参数,判断是否对csv格式文件的"做处理。 需要注意的是如果是连续多个空白处是作为一处分割来处理 。

例:

Table.SplitColumn(源,"姓名",Splitter.SplitTextByWhitespace())=

解释:参数未写,则默认为1代表不处理,也就是把"张  三"是作为单个字符来处理,也就是空白的地方不作为单独字符,所以为产生拆分。

Table.SplitColumn(源,"姓名",Splitter.SplitTextByWhitespace(0))=

因为第2参数为0,所以"是作为一个字符来处理,即使是有2个空白,但是因为是连续的,所以也就按1个空白处理进行拆分。

至此我们把分割函数Table.SplitColumn的第3参数给介绍完了,当然我们之前在介绍的时候也有包括介绍了其第4参数

如何使用 Power Query 的 Web.Contents 发布多部分/表单数据

【中文标题】如何使用 Power Query 的 Web.Contents 发布多部分/表单数据【英文标题】:How to POST a multipart/form-data using Power Query's Web.Contents 【发布时间】:2015-02-06 08:35:46 【问题描述】:

在 Power Query 中,我可以使用 Web.Contents 函数从 Web 下载数据,但是有一个 api 要求请求包含以下格式的多部分/表单数据

"__rdxml"=<*Some data*>

那么如何使用 Web.Contents 函数来做到这一点呢?

我试过了,做

...
PostContent = "__rdxml=<*Some data*>",
Source Web.Contents(url,Content=Text.ToBinary(PostContent))
...

但是服务器响应400 Bad Request

我用 Fiddler 检查了原始请求,似乎请求没有使用content-type=multipart/form-data 标头发送。

我尝试使用content-type=multipart/form-data 手动添加内容类型标头,但这也不起作用。回复中的 400 Bad Request 相同。

有什么想法吗?

【问题讨论】:

【参考方案1】:

multipart/form-data 是一种相当复杂的编码,需要一堆特定于 MIME 的标头。我会先尝试看看您是否可以改用 application/x-www-form-urlencoded:

let
    actualUrl = "http://some.url",
    record = [__rdxml="some data"],
    body = Text.ToBinary(Uri.BuildQueryString(record)),
    options = [Headers =[#"Content-type"="application/x-www-form-urlencoded"], Content=body],
    result = Web.Contents(actualUrl, options)
in
    result

编辑:我提出了一个将 multipart/form-data 与 Power Query 结合使用的示例。在https://gist.github.com/CurtHagenlocher/b21ce9cddf54e3807317

【讨论】:

如果正文中需要多个值,可以在记录中将它们作为逗号分隔值添加为值数组。此外,为了便于阅读,请放在下一行。即记录 = [field1="一些数据", field2="一些数据"]

以上是关于Power Query中数据分割函数详解(3)的主要内容,如果未能解决你的问题,请参考以下文章

power query中M函数和处理数据

power query怎样设置M函数的字符区间

Power Query 处理间断序列数据的展开

在 Power Query M 函数中声明变量

powerquery的sum公式

利用Power Query的参数设置来快速生成自定义函数