Google Dataflow - 由GoogleSheets支持的BigQuery工作
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Google Dataflow - 由GoogleSheets支持的BigQuery工作相关的知识,希望对你有一定的参考价值。
我有一个用Java编写的Google Dataflow批处理作业。
- 这个Java代码访问Bigquery并执行一些转换,然后输出回Bigquery。
- 这段代码可以很好地访问Bigquery表。
但是,当我选择一个由联合来源(如Google工作表)支持的表时,它不起作用。
它表示找不到包含Google云端硬盘范围的OAuth令牌。
PipelineOptions options = PipelineOptionsFactory.fromArgs(args).withValidation().create();
Pipeline p1 = Pipeline.create(options);
有任何想法吗?
答案
你能试一下吗:
gcloud auth login --enable-gdrive-access
在启动Dataflow作业之前?
另一答案
回答我自己的问题,但为了解决这个问题,我将使用Google Apps脚本作为本地表上传到Bigquery。
请看这个link.
我只是将Load CSV数据代码片段修改为BigQuery,然后创建一个可安装的触发器,每晚执行此功能以上传到Bigquery。
请注意,您无法执行需要授权的onEdit,onOpen等触发器。
以上是关于Google Dataflow - 由GoogleSheets支持的BigQuery工作的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Dataflow 和 Google Cloud Dataproc 有啥区别?
如何在 google-dataflow 中读取 cassandra
确定导致 Google Dataflow 作业失败的特定输入数据