匹配特定的字符串格式 - REGEXP_CONTAINS - GBQ 语言

Posted

技术标签:

【中文标题】匹配特定的字符串格式 - REGEXP_CONTAINS - GBQ 语言【英文标题】:Match specific string format - REGEXP_CONTAINS - GBQ Language 【发布时间】:2021-09-09 13:19:14 【问题描述】:

我正在尝试编写一个只匹配与特定格式匹配的表名的查询,该格式如下:FirstWord1_SecondWord2_ThirdWord3。

所以我想要得到的只是与三个字母数字单词的格式相匹配的表名,这些单词由下划线分隔。

我一直在努力锻炼使用 REGEXP_CONTAINS 获得我想要的结果的确切方法。下面是我能达到的最接近的结果,但它不会返回任何结果,尽管我知道有些表与我要查询的格式匹配。

SELECT table_name as tablenames
FROM project.dataset.INFORMATION_SCHEMA.TABLES
WHERE (
    REGEXP_CONTAINS(table_name, '^([[:alnum:]]+_[[:alnum:]]+_[[:alnum:]])$')
)

对此的任何帮助将不胜感激!

【问题讨论】:

【参考方案1】:

您最后一个 [[:alnum:]] 缺少一个 + 来表示 1 个或多个匹配字符。

SELECT table_name as tablenames
FROM project.dataset.INFORMATION_SCHEMA.TABLES
WHERE (
    REGEXP_CONTAINS(table_name, '^([[:alnum:]]+_[[:alnum:]]+_[[:alnum:]]+)$')
)

SELECT table_name as tablenames
FROM project.dataset.INFORMATION_SCHEMA.TABLES
WHERE (
    REGEXP_CONTAINS(table_name, '^[[:alnum:]]+_[[:alnum:]]+_[[:alnum:]]+$')
)

让我知道这是否适合你。

【讨论】:

啊,我没有意识到 + 号是这样做的,谢谢!

以上是关于匹配特定的字符串格式 - REGEXP_CONTAINS - GBQ 语言的主要内容,如果未能解决你的问题,请参考以下文章

常用的正则表达式格式

Regex-在给定数量的3个字母序列之后,如何匹配特定的3个字母序列?

tcl 正则匹配与替换

正则表达式匹配多个字符串但不匹配特定字符串

创建正则表达式以匹配 00:00:00 的格式持续时间(不是时间)

特定中文字符串正则匹配