UNION ALL 参数化查询

Posted

技术标签:

【中文标题】UNION ALL 参数化查询【英文标题】:UNION ALL parameterised queries 【发布时间】:2019-04-02 20:10:17 【问题描述】:

我有一个工作正常的查询。问题是该查询的一部分是需要从文件中读取的字符串。查询每个字符串会产生 6 个输出。我需要该文件的所有结果的联合,以便最终结果是一个包含 6 倍字符串数的表。我可以使用 Python 读取文件。

我已经尝试过使用参数化查询。它们每个只返回基于字符串的 6 行。

我的大部分 Python 代码都基于 BigQuery 的文档 here。

query = """
    SELECT pet_id, age, name
    FROM `myproject.mydataset.mytable`
    WHERE name = @name
    AND species = @species;
"""
query_params = [
    bigquery.ScalarQueryParameter('name', 'STRING', 'Max'),
    bigquery.ScalarQueryParameter('species', 'INT64', 'Dog'), 
    bigquery.ScalarQueryParameter('name', 'STRING', 'Alfred'), 
    bigquery.ScalarQueryParameter('species', 'INT64', 'Cat')
]
job_config = bigquery.QueryJobConfig()
job_config.query_parameters = query_params
query_job = client.query(
    query,
    # Location must match that of the dataset(s) referenced in the query.
    location='US',
    job_config=job_config)  # API request - starts the query

# Print the results
for row in query_job:
    print(': \t'.format(row.word, row.word_count))

如何获得这些查询结果的 UNION ALL?

输出应该是这样的

pet_id | age | name
___________________
1      | 5   | Max
2      | 8   | Alfred

【问题讨论】:

对于标准库之外的方法,请包含所有import 【参考方案1】:

请看下面使用公共数据的例子(你也可以运行查询)

#standardSQL
SELECT * 
FROM `bigquery-public-data.baseball.schedules`
WHERE (year, duration_minutes) IN UNNEST([(2016, 187), (2016, 165), (2016, 189)])

这里的关键是为您提供一个您想要用来过滤表的值数组,并使用 IN UNNEST(array_of_values) 来完成这项工作,理想情况下如下所示:

query = """
    SELECT pet_id, age, name
    FROM `myproject.mydataset.mytable`
    WHERE (name, species) IN UNNEST(@filter_array);
"""

遗憾的是,BigQuery Python API 不允许您将 array< struct<string, int64> > 指定为查询参数。所以你可能必须这样做:

query = """
    SELECT pet_id, age, name
    FROM `myproject.mydataset.mytable`
    WHERE concat(name, "_", species) IN UNNEST(@filter_array);
"""
array_of_pre_concatenated_name_and_species = ['Max_Dog', 'Alfred_Cat']
query_params = [
    bigquery.ArrayQueryParameter('filter_array', 'STRING', array_of_pre_concatenated_name_and_species),
]

【讨论】:

我的查询更像WITH str AS ( SELECT 'Max' AS STRING) SELECT name from main_table as mt INNER JOIN str ON mt.name == str.STRING。字符串“Max”来自文件。我应该把IN UNNEST(@filter_array) 声明放在哪里? 目前,我已将这些字符串从文件中提取到表中。这样我就可以让INNER JOIN 工作了。如果我不必摄取会更好。 @PranayNanda,在上面的例子中,你的字符串被放入这个数组array_of_pre_concatenated_name_and_species = ['Max_Dog', 'Alfred_Cat']

以上是关于UNION ALL 参数化查询的主要内容,如果未能解决你的问题,请参考以下文章

根据 when 语句中的不同日期参数多次运行查询并合并结果,而不是多个 UNION ALL

是否可以在 Postgres 中执行并行查询,使用 union all 查询分区表?

如何放心参数化.json文件?

PDO 参数化与非参数化查询速度

参数个数错误(参数化查询)

sql参数化查询