Mongodb 到 Bigquery 的导入问题

Posted

技术标签:

【中文标题】Mongodb 到 Bigquery 的导入问题【英文标题】:Mongo to Big Query Import Issues 【发布时间】:2019-05-08 16:02:35 【问题描述】:

当从 mongo 导入到 big-query 时,会出现以下错误。我们有一个脚本,它从 s3 上的 mongo 转储中准备数据(大约 2.8GB),然后将其转换为“NEWLINE_DELIMITED_JSON”。

该脚本直到最近都运行良好,并且没有更改。

有人知道如何解决此问题并找到导致问题的文档吗?

"status": 
    "errorResult": 
      "message": "Error while reading data, error message: JSON table encountered too many errors, giving up. Rows: 41081; errors: 1. Please look into the errors[] collection for mor
e details.",
      "reason": "invalid"
    ,
    "errors": [
      
        "message": "Error while reading data, error message: JSON table encountered too many errors, giving up. Rows: 41081; errors: 1. Please look into the errors[] collection for m
ore details.",
        "reason": "invalid"
      ,
      
        "message": "Error while reading data, error message: JSON processing encountered too many errors, giving up. Rows: 41081; errors: 1; max bad: 0; error percent: 0",
        "reason": "invalid"
      ,
      
        "message": "Error while reading data, error message: JSON parsing error in row starting at position 2890606042: Parser terminated before end of string",
        "reason": "invalid"
      
    ],
    "state": "DONE"

【问题讨论】:

拥有一些您尝试导入的示例数据会有很大帮助 您也可以查看邮件中提到的errors[] collection 的详细信息 【参考方案1】:

小心您的数据。我遇到了同样的问题,结果发现一个字段有一个 NaN 值,这对于我们的应用程序(在 Python/TS 中)是可以的,但对于 BigQuery 却不是。

【讨论】:

以上是关于Mongodb 到 Bigquery 的导入问题的主要内容,如果未能解决你的问题,请参考以下文章

将 XLS 文件从 GCS 导入 BigQuery

BigQuery 双重导入

从 bigquery 导入到 google 表格限制为 10k 行

是否可以创建每天将SQL数据库写入MongoDB的管道?

我们可以将 BigQuery 中的数据导入 Google 表格吗?

Dataproc 笔记本无法导入或导出到 BigQuery:找不到类异常