在 AutoML 批量预测结果中指定 BigQuery 数据集/表的名称

Posted

技术标签:

【中文标题】在 AutoML 批量预测结果中指定 BigQuery 数据集/表的名称【英文标题】:Specifying BigQuery dataset/table's name on AutoML Batch Prediction results 【发布时间】:2020-03-30 19:20:21 【问题描述】:

基本上我想在 AutoML 的批量预测结果上指定 BigQuery 数据集/表的名称。

但是查看以下文档,数据集和表的名称是自动生成的。每次执行的批量预测都会创建一个新数据集。

https://cloud.google.com/automl-tables/docs/predict-batch#bq-results

查看以下文档,BigQuery 目标上只能指定 projectId:

https://cloud.google.com/automl/docs/reference/rest/v1beta1/BigQueryDestination

我计划每周自动进行批量预测。为了使预测结果“更清晰”,我想将所有预测结果分组到一个数据集中,而不是为每个批量预测使用单独的数据集。

有没有办法通过提供的 API 来完成?

【问题讨论】:

你知道如何自动化吗? 批量预测完成后,生成的数据集/表的名称将在“操作”API(get)的响应中返回。因此,我通过在单独的进程中使用返回的名称将结果聚合到一个表中。 cloud.google.com/automl/docs/reference/rest/v1/… 【参考方案1】:

如果没有记录,则无法通过 API 执行此操作,那么,如果您想在同一数据集中创建所有输出,您可以将结果发送到存储桶目录 [1],这样它将创建您的 Google Cloud Storage Bucket 中有多个 CSV 文件 [2]。

因此,现在您必须创建一种方法来从该存储桶中读取新文件,并在每次进行批量预测时在所需数据集中创建一个新表。 这是一个文档,向您展示如何从 Google Cloud Storage [3] 中的 CSV 文件创建新表。

另一种方法是从新创建的表转移到所需的数据集 [4],但每次创建新表时都必须这样做。

[1]https://cloud.google.com/automl-tables/docs/predict-batch#using_csv_files_in

[2]https://cloud.google.com/automl-tables/docs/predict-batch#csv-results

[3]https://cloud.google.com/bigquery/external-data-cloud-storage#creating_and_querying_a_permanent_external_table

[4]https://cloud.google.com/bigquery/docs/managing-tables#copying_a_single_source_table

【讨论】:

以上是关于在 AutoML 批量预测结果中指定 BigQuery 数据集/表的名称的主要内容,如果未能解决你的问题,请参考以下文章

GCP Vertex AI 中的批量预测

对Jmeter响应数据中指定内容导出到excel

(GCP) AutoML 视觉图像预测——模型的预测功能究竟如何?

安排批量预测 Vertex AI

使用“?::TIMESTAMP_NTZ”在查询中指定类型时,Snowflake JDBC 批量插入失败并显示“绑定变量?未设置”

通过windows画图软件(工具)确定图像中指定区域的坐标范围知道坐标范围就可以批量对图像进行裁剪(crop)操作