easy Excel是分片写入嘛
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了easy Excel是分片写入嘛相关的知识,希望对你有一定的参考价值。
参考技术A 不是。1、easyExcel写操作只有两种写法,一种是不创建对象的写入,另一种是根据对象写入。
2、从excel中读取数据,常用的场景就是读取excel的数据,将相应的数据保存到数据库中。
在 Dataflow 中从 BigQuery 写入云存储时如何设置文件大小而不是分片数
【中文标题】在 Dataflow 中从 BigQuery 写入云存储时如何设置文件大小而不是分片数【英文标题】:How to set file size instead of number of shards when writing from BigQuery to Cloud Storage in Dataflow 【发布时间】:2019-09-18 21:11:44 【问题描述】:目前使用 Dataflow 从 BigQuery 中读取表数据,并使用一定数量的分片写入 Cloud Storage。
//Read Main Input
PCollection<TableRow> input = pipeline.apply("ReadTableInput",
BigQueryIO.readTableRows().from("dataset.table"));
// process and write files
input.apply("ProcessRows", ParDo.of(new Process())
.apply("WriteToFile", TextIO.write()
.to(outputFile)
.withHeader(HEADER)
.withSuffix(".csv")
.withNumShards(numShards));
为了管理文件大小,我们估计了将文件保持在特定大小之下所需的分片总数。
有没有办法代替设置分片数量,设置文件大小并让分片动态化?
【问题讨论】:
【参考方案1】:按照设计,这是不可能的。如果您深入了解 Beam 的核心,您会以编程方式定义执行图,然后运行它。该过程在同一节点或多个节点/VM 上是大规模并行的(ParDo
表示“并行执行”)。
这里的分片数就是并行写入文件的“写入器”的数量。然后 PCollection 将被拆分到所有 worker 写入。
大小是非常可变的(例如消息的大小,文本编码、压缩与否以及压缩因子,...),Beam 不能依赖它来构建它的图表。
【讨论】:
以上是关于easy Excel是分片写入嘛的主要内容,如果未能解决你的问题,请参考以下文章