使用java.Without使用作业加载数据,将json数据流式传输到Bigquery

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用java.Without使用作业加载数据,将json数据流式传输到Bigquery相关的知识,希望对你有一定的参考价值。

我是bigquery的新手,所以我不完全理解如何将数据流传输到bigquery,这是我的问题,我有jsonInString,从这样的对象映射

    String customerJsonInString = mapper.writeValueAsString(customer);

   {
  "id": "1",
  "first_name": "John",
  "last_name": "Doe",
  "dob": "1968-01-22",
  "addresses": [
    {
      "status": "current",
      "address": "123 First Avenue",
      "city": "Seattle",
      "state": "WA",
      "zip": "11111",
      "numberOfYears": "1"
    },
    {
      "status": "previous",
      "address": "456 Main Street",
      "city": "Portland",
      "state": "OR",
      "zip": "22222",
      "numberOfYears": "5"
    }
  ]
}

该表已使用正确的架构创建。现在我想将这些数据流式传输到bigquery(插入行),我正在使用(https://cloud.google.com/bigquery/streaming-data-into-bigquery#bigquery-stream-data-java)上的示例来使它适应我的,这是我试过的,

TableId tableId = TableId.of(DATASET_NAME,TABLE_NAME);
        Map<String, Object> recordsContent = new HashMap<>();
        recordsContent.put("Customer", customerJsonInString);
        InsertAllResponse response = bigquery.insertAll(InsertAllRequest.newBuilder(tableId)
                        .addRow("rowId", recordsContent)
                        .build());
        if (response.hasErrors()) {
            for (Entry<Long, List<BigQueryError>> entry : response.getInsertErrors().entrySet()) {
            }
        }
答案

我猜这张桌子的架构是id, first_name, last_name, ...而不是customer?在这种情况下,您需要逐个设置字段而不是整个json字符串,例如recordsContent.put("id", 1)。 检查example with comments

以上是关于使用java.Without使用作业加载数据,将json数据流式传输到Bigquery的主要内容,如果未能解决你的问题,请参考以下文章

使用 DataFlow 作业加载分区表

BigQuery 加载作业 [无效] 遇到太多错误

BigQuery 加载作业不会插入所有数据

如何在数据加载之前截断 AWS Glue 作业中的 RDS 表?

加载作业尝试使用 java 将 json 插入 BigQuery 表时解析错误

将批量数据从 s3 加载到 redshift