如何从 Redshift 的正则表达式组中选择第一个结果?
Posted
技术标签:
【中文标题】如何从 Redshift 的正则表达式组中选择第一个结果?【英文标题】:How do you select the first results from a regex group in Redshift? 【发布时间】:2019-09-06 19:46:45 【问题描述】:我在 Redshift 中有一个列,我需要从查询字符串中解析出一个 ID。以下正则表达式适用于所有测试人员,但我似乎无法让 Redshift 只返回第一组“75714ae471df63202106404675dasd800097erer1849995367”
我错过了什么?
正则表达式和 Redshift 查询
SELECT
REGEXP_SUBSTR(a.attributes_value, 'GA_ClientID__c\";[^\"]*\([^\"]*)',1) AS ga_clientid
FROM TABLE
字符串片段
"GA_ClientID__c";s:38:"75714ae471df63202106404675dasd800097erer1849995367";
下面列出的完整字符串
99524";s:9:"FirstName";s:2:"John";s:8:"LastName";s:8:"Doe";s:7:"Company";s:10:"Sample";s:5:"Email";s:20:"xxxxx@gmail.com";s:5:"Phone";s:10:"8888888888";s:7:"Country";s:13:"United States";s:5:"Title";s:8:"Creative";s:5:"State";s:2:"NC";s:13:"Last_Asset__c";s:40:"White Paper: Be a More Strategic Partner";s:16:"Last_Campaign__c";s:18:"70160000000q6TgAAI";s:16:"Referring_URL__c";s:8:"[direct]";s:19:"leadPriorityMarketo";s:2:"P2";s:18:"ProductInterest__c";s:9:"sample";s:14:"landingpageurl";s:359:"https://www.sample.com;mkt_tok=samplesamplesamplesample";s:14:"GA_ClientID__c";s:38:"75714ae471df63202106404675dasd800097erer1849995367";s:13:"Drupal_SID__c";s:36:"e1380c07-0258-47de-aaf8-82d4d8061e1a";s:4:"form";s:4:"1046"; ```
【问题讨论】:
【参考方案1】:在左括号之前,您必须匹配第一个左括号 "
的右括号 "
,如果您想匹配第二个匹配的右括号 "
,您也可以添加它。
您必须不转义左括号 \(
以使其成为分组结构的左括号。
请注意,您不必转义 \"
GA_ClientID__c";[^"]*"([^"]*)"
^^ ^
Regex demo
【讨论】:
【参考方案2】:试试这个:
GA_ClientID__c";[^"]*"(.*?)"
演示:https://regex101.com/r/lINoQm/1
【讨论】:
以上是关于如何从 Redshift 的正则表达式组中选择第一个结果?的主要内容,如果未能解决你的问题,请参考以下文章
Redshift:如何从字符串列表中匹配最长的正则表达式字符串
Redshift中的ROW_NUMBER()从每个组中选择最大的行?