大查询:出乎意料。请在加载 53GB CSV/1.4GB gZIP 时重试

Posted

技术标签:

【中文标题】大查询:出乎意料。请在加载 53GB CSV/1.4GB gZIP 时重试【英文标题】:Bigquery : Unexpected. Please try again when loading a 53GB CSV/ 1.4GB gZIP 【发布时间】:2013-03-30 16:53:59 【问题描述】:

我试图将 1.4Gb gZIP 数据加载到我的 BigQuery 表中,但出现意外错误。请始终重试

job_7f1aa8d29ae641459c82243530eb1c65

我正在尝试加载结构行 ID、订单优先级、折扣、单价、运费、客户 ID、客户名称、发货方式、产品类别、产品子类别、产品基础利润、地区、州或省,城市,邮政编码,订单日期,发货日期,利润,新订购数量,销售额,订单编号

错误并不清楚发生了什么问题。

还有其他人遇到过这个错误吗?

谢谢。

【问题讨论】:

你能说得更具体点吗?例如,描述 CSV 的结构、定义的架构、数据示例等。 您应该使用这些信息更新您的问题,而不是放在评论中。 【参考方案1】:

您的工作似乎超时了 - 一个 53 GB 的 CSV 文件需要在一个线程中处理很多。最佳做法是将数据拆分为多个块,或上传可并行处理的未压缩数据。

我正在稍微提高允许的时间,当发生这种情况时,我们将努力改进错误消息。

【讨论】:

以上是关于大查询:出乎意料。请在加载 53GB CSV/1.4GB gZIP 时重试的主要内容,如果未能解决你的问题,请参考以下文章

实验16-09 请在testdb中:查询既订购了“16M DRAM”商品...

无法在 Python 中使用 Pandas 或 Blaze 加载大文件(~2gb)

谷歌云存储/大查询成本估算

System.OutOfMemoryException - 当实体框架查询 Varbinary 类型的太大数据时

Amazon redshift 查询在 1 小时后自动中止

虚拟主机问题。有两个 vhost 文件,但结果出乎意料 第二个站点未正确加载