BigQuery 中的部分 JSON 架构

Posted

技术标签:

【中文标题】BigQuery 中的部分 JSON 架构【英文标题】:partial JSON schema in BigQuery 【发布时间】:2013-09-19 15:40:37 【问题描述】:

我有一个包含很多字段的 JSON 文件。我不想将它们全部导入我的表中。 假设有一个包含数百个字段的 JSON 文件,但我只想在 BigQuery 中对其进行简要介绍。有人可以给我一个例子吗? 当我只输入架构的一部分时,我得到了错误。

【问题讨论】:

你能告诉我们你有什么输出数百个字段吗?这会让我们知道你在做什么,我们可以告诉你如何改变它 【参考方案1】:

如果您没有想要保留的嵌套/重复字段,您可以加载整个内容并运行查询以仅选择您想要保留的字段并将结果保存为新表(您'将要为此使用'允许大结果'选项)。

或者,您可以只保留表中的所有字段。您仍然需要为存储所有这些内容付费,但您不会为查询它们付费(除非您确实对它们进行查询,这意味着它们可能很有价值,无论如何保留)。

【讨论】:

谢谢,但我有嵌套字段。实际上,我想从一个独特的数据源为不同的用户提供不同的视图,比如在 Hive 中定义不同的外部表。如果您告诉我在 BigQuery 中执行此操作的正确方法是什么,我将不胜感激?

以上是关于BigQuery 中的部分 JSON 架构的主要内容,如果未能解决你的问题,请参考以下文章

使用 bigquery 中的 bigquery select 语句的 JSON 格式的现有表的架构

如何在 Python 中的 Json 中删除 Null:[]

单独 JSON 文件中的 Terraform Bigquery 表架构

Cloud Dataflow 中的“辅助输入”是不是支持从 BigQuery 视图中读取?

尝试读取 BigQuery 表中的 JSON 结构时出错

有没有办法将架构的内容创建到 BigQuery 中的表中?