Google bigquery中的提取工作者是否将数据保存到Columnar Storage遵循FIFO模式?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Google bigquery中的提取工作者是否将数据保存到Columnar Storage遵循FIFO模式?相关的知识,希望对你有一定的参考价值。

据我所知,bigquery streaming insert lifecycle 也在下图中显示。数据在Columnar Storage中可用之前通过流缓冲区。处理数据的工作由Extraction Workers完成。

但是,在文档中,没有提到提取工作者如何处理数据。他们是按照随机顺序进行处理还是进行FIFO处理?

enter image description here

答案

流缓冲区是一个队列,提取工作程序按顺序处理行。提取工作者在达到一定数量的数据时或者在经过一定时间后从队列中取出,以便将足够大的数据块写入托管存储。 BigQuery中的底层存储格式是Capacitor,它重新排序行,因为它将它们持久化到磁盘并执行各种其他优化。

以上是关于Google bigquery中的提取工作者是否将数据保存到Columnar Storage遵循FIFO模式?的主要内容,如果未能解决你的问题,请参考以下文章

将数据从键值对提取到 Google Bigquery 中的列标题

用于将 HLL_COUNT.INIT 提取到 BigQuery 的 Google DataFlow API

Google Cloud Data Fusion 将 Excel 提取到 Bigquery

在 BigQuery Google Analytics 数据中的两个页面之间提取用户旅程数据

使用 Google BigQuery 从 JSON 中的多个属性值中提取值

从 Google Ads BigQuery 数据传输中提取/取消嵌套数组