尝试从 Big Query 导出时出现内部错误

Posted

技术标签:

【中文标题】尝试从 Big Query 导出时出现内部错误【英文标题】:Getting an internal error trying to export from Big Query 【发布时间】:2015-10-29 09:30:49 【问题描述】:

我需要修复一些 BQ 表,唯一的方法似乎是导出它们,在本地修复并重新上传。但是我所有的出口尝试都失败了。下面只是一个例子。我正在使用命令行bq

bq extract --compression=GZIP --destination_format=NEWLINE_DELIMITED_JSON test.US_2015_05 gs://???/us-2015-05--*.gz
BigQuery error in extract operation: Error processing job '???:bqjob_r1dbda9e5_00000150b2e288eb_1': An internal error occurred and the request could not be completed.

如果我从 URI 中去掉通配符,我会得到一个不同的错误。

'???:bqjob_r3e0f4cf0_00000150b2e6daf6_1': Table gs://???/us-2015-05.json too large to be exported to a single file. Specify a uri including a * to shard export.

此外,我不能使用默认的 CSV 导出,因为我的表具有 REPEATED 字段。所以它必须是 JSON(压缩与否)。

有什么想法吗?

[编辑] 如果我尝试从 Web UI 导出,我会遇到同样的内部错误。

【问题讨论】:

是什么让您觉得您无法在 BQ 中修复您的表格?有什么细节吗?解决原始问题(如果存在)与解决方法选项问题相比可能更理想 好吧,想象一下在一个 170GB 大的表中有一个非常复杂的层次结构,你突然意识到缺少 4 层深的字段。给定带有某种键/值数据的附加表,您将如何解决这个问题?目标是保留原始表的结构(不展平)并添加新字段。如果您认为自己有解决方案,我很乐意发布一个单独的问题,让您有机会在那里回答。我相信这是一个常见的 BQ 问题,每个人都会从中受益。 我想我们应该试试。 170GB对于BQ来说真的不算什么,4级应该没问题。但可能取决于实际情况 【参考方案1】:

“内部错误”是我们跨区域执法中的一个错误:我们的错误地图中缺少一个欧洲区域,而您偶然发现了它。很抱歉给您带来不便,我们会尽快解决此问题。

【讨论】:

最困扰我的是我偶然发现了一个解决方案。我想我会尝试一些愚蠢的事情 - 它奏效了!【参考方案2】:

经过多次反复摆弄,解决方案非常简单,但与普通的“内部错误”完全不一致。

我尝试导出到的存储桶位于欧盟地区,这似乎让 BQ 感到困惑。在美国地区创建一个全新的存储桶使其发挥作用。

现在,我无法理解这是一个“内部错误”。尽管如此,我很高兴我得到了这个工作。我希望这可以帮助某人节省一些浪费的时间。

【讨论】:

以上是关于尝试从 Big Query 导出时出现内部错误的主要内容,如果未能解决你的问题,请参考以下文章

Big Query 返回的内部错误

访问 $GITLAB/admin/runners 时出现内部服务器错误 500

从 javascript 调用 webmethod 时出现 ASP.NET 500 内部服务器错误

执行基本 SQL 语句时出现内部服务器错误 [重复]

从 Nuxt 上传到 AWS S3 存储桶时出现 500 内部服务器错误

使用 Spark Java 在 Big Query 中写入 Date 数据类型时出现问题