将多行文本插入 Google Big Query

Posted

技术标签:

【中文标题】将多行文本插入 Google Big Query【英文标题】:inserting multiline text into Google Big Query 【发布时间】:2019-09-29 14:29:18 【问题描述】:

我有给我的 .txt 文件。该文件有两列:

ID         | DESCRIPTION
========================
STRING     | MULTI_LINE STRING

所以我遇到的问题是这个大文本文件在从记录到记录时包含多行。

例子:

548f8c9d4b78987b76f86018|facebook|I am a complete description.  Please see what I like below:

-Cars
-Trains
-Computers

I also like Star Trek
w6nc1y0afl2jo3zo9z7jvpo|facebook|I am another description.  HI!

如何将多线接入GBQ? 谢谢。

【问题讨论】:

【参考方案1】:

一种方法是首先将此文件转换为 JSON 格式。

新行可以编码为\n 字符。

然后将load JSON from GCS 或load from local file 放入一个表中。

示例 JSON 文件:

"id":"1","first_name":"John\nsecond line"
"id":"2","first_name":"Jane\nsecond line"

结果表

+-------------+----+
| first_name  | id |
+-------------+----+
| John        |  1 |
| second line |    |
| Jane        |  2 |
| second line |    |
+-------------+----+

【讨论】:

【参考方案2】:

这会将文件加载到 BigQuery 中,但前提是您手动将引号 " 添加到多行句子中:

bq load --allow_quoted_newlines -F "|" dataset.table file.tsv "a,b,c"

修改后的文件如下所示:

i|i|i
548f8c9d4b78987b76f86018|facebook|"I am a complete description.  Please see what I like below:

-Cars
-Trains
-Computers

I also like Star Trek"
w6nc1y0afl2jo3zo9z7jvpo|facebook|I am another description.  HI!

BigQuery 会很好地理解这一点:

【讨论】:

你添加它们:/

以上是关于将多行文本插入 Google Big Query的主要内容,如果未能解决你的问题,请参考以下文章

如何将多行文本插入框架/图像

Excel将不同的单元格内容插入多行文本块?

如何通过 Google 表格中的二维数组通过 Apps 脚本插入 Big Query?

将数据流从 Google Cloud Storage 流式传输到 Big Query

使用 Google Apps 脚本将查询中的数据加载到 Big Query - 缺少必需参数

如何在 vi/Vim 中的多行选择的开头插入文本