github 示例上的 SQL/BigQuery
Posted
技术标签:
【中文标题】github 示例上的 SQL/BigQuery【英文标题】:SQL/BigQuery on github samples 【发布时间】:2019-11-21 14:35:08 【问题描述】:我正在使用 google bigquery 工具,我正在尝试选择所有具有 pom.xml 文件并且在文件内容中具有工件 id ex-ex 的示例 github 存储库,例如
<artifactId>ex-ex</artifactId>
为此,我将其分为两个步骤:
1) 查找所有 pom.xml 文件
SELECT sample_repo_name FROM 'bigquery-public-data.github_repos.sample_contents' WHERE sample_path LIKE 'pom.xml'
2) 选择包含 ex-ex 工件的存储库(在内容表中)
AND content LIKE '%ex-ex'
查询的第二部分不起作用(未找到结果),可能是由于某处的一些语法错误。完整查询如下:
SELECT sample_repo_name FROM 'bigquery-public-data.github_repos.sample_contents' WHERE sample_path LIKE 'pom.xml' AND content LIKE '%ex-ex' LIMIT 1000
非常感谢您的帮助,谢谢!
【问题讨论】:
【参考方案1】:你试过'%ex-ex%'
吗?如果没有第二个 %
,您将只搜索最后 5 个字符为 'ex-ex'
的记录。在您的第一个查询中将content
添加到select
并抽查一些结果,content
字段似乎是 XML(pom.xml,duh)并且似乎以 </project>
结尾,因此可能永远不会匹配'%ex-ex'
。
【讨论】:
以上是关于github 示例上的 SQL/BigQuery的主要内容,如果未能解决你的问题,请参考以下文章
Docusign Python SDK 身份验证示例错误:错误请求