如何从 Redshift 的正则表达式组中选择第一个结果?

Posted

技术标签:

【中文标题】如何从 Redshift 的正则表达式组中选择第一个结果?【英文标题】:How do you select the first results from a regex group in Redshift? 【发布时间】:2019-09-06 19:46:45 【问题描述】:

我在 Redshift 中有一个列,我需要从查询字符串中解析出一个 ID。以下正则表达式适用于所有测试人员,但我似乎无法让 Redshift 只返回第一组“75714ae471df63202106404675dasd800097erer1849995367”

我错过了什么?

正则表达式和 Redshift 查询

SELECT 

REGEXP_SUBSTR(a.attributes_value, 'GA_ClientID__c\";[^\"]*\([^\"]*)',1) AS ga_clientid

FROM TABLE

字符串片段

"GA_ClientID__c";s:38:"75714ae471df63202106404675dasd800097erer1849995367";

下面列出的完整字符串

99524";s:9:"FirstName";s:2:"John";s:8:"LastName";s:8:"Doe";s:7:"Company";s:10:"Sample";s:5:"Email";s:20:"xxxxx@gmail.com";s:5:"Phone";s:10:"8888888888";s:7:"Country";s:13:"United States";s:5:"Title";s:8:"Creative";s:5:"State";s:2:"NC";s:13:"Last_Asset__c";s:40:"White Paper: Be a More Strategic Partner";s:16:"Last_Campaign__c";s:18:"70160000000q6TgAAI";s:16:"Referring_URL__c";s:8:"[direct]";s:19:"leadPriorityMarketo";s:2:"P2";s:18:"ProductInterest__c";s:9:"sample";s:14:"landingpageurl";s:359:"https://www.sample.com;mkt_tok=samplesamplesamplesample";s:14:"GA_ClientID__c";s:38:"75714ae471df63202106404675dasd800097erer1849995367";s:13:"Drupal_SID__c";s:36:"e1380c07-0258-47de-aaf8-82d4d8061e1a";s:4:"form";s:4:"1046"; ```

【问题讨论】:

【参考方案1】:

在左括号之前,您必须匹配第一个左括号 " 的右括号 ",如果您想匹配第二个匹配的右括号 ",您也可以添加它。

您必须不转义左括号 \( 以使其成为分组结构的左括号。

请注意,您不必转义 \"

GA_ClientID__c";[^"]*"([^"]*)"
                     ^^      ^

Regex demo

【讨论】:

【参考方案2】:

试试这个:

GA_ClientID__c";[^"]*"(.*?)"

演示:https://regex101.com/r/lINoQm/1

【讨论】:

以上是关于如何从 Redshift 的正则表达式组中选择第一个结果?的主要内容,如果未能解决你的问题,请参考以下文章

Redshift:如何从字符串列表中匹配最长的正则表达式字符串

Redshift中的ROW_NUMBER()从每个组中选择最大的行?

如何从正则表达式捕获组中修剪空白?

Redshift 正则表达式错误?

Perl 中的正则表达式组:如何从正则表达式组中捕获与字符串中出现的未知数量/多个/变量匹配的元素到数组中?

在 redshift 中使用正则表达式和 casestatements 语句