BigQuery 和 GCP 上的存储有啥区别?

Posted

技术标签:

【中文标题】BigQuery 和 GCP 上的存储有啥区别?【英文标题】:what is the difference between BigQuery and Storage on GCP?BigQuery 和 GCP 上的存储有什么区别? 【发布时间】:2021-02-24 21:35:52 【问题描述】:

大家好,我是第一次使用 GCP,当我使用模拟数据浏览项目的云功能示例时,我对每个项目的相似之处/不同之处感到困惑,我想更清楚地了解它们的不同之处因为在我看来它们是如此相似。

【问题讨论】:

你觉得有什么相似之处? 【参考方案1】:

BigQuery 是一个数据仓库和一个 SQL 引擎。您可以使用它将表格数据存储在数据集和表中。在表中,您还可以存储更复杂的结构,例如数组和 JSON,但不能存储文件。

Cloud Storage 是一个 blob 存储,其功能类似于您在 linux/windows 机器中所知道的功能(保存文件、文件夹、删除、复制)。当然,在后端它与您的本地文件系统完全不同。

【讨论】:

【参考方案2】:

BigQuery 是一个完全托管的无服务器数据仓库。就像SnowflakeRedshift

Google Cloud Storage(GCS) 类似于 Amazon S3Azure Storage。顾名思义,存储就是用来存储数据的。

您通常使用BigQuery 来分析和查询数据以得出一些见解。 BigQuery 是一个分析引擎。

GCS(Google Cloud Storage)可以存储图片、视频、日志、文件等,BigQuery不行。

【讨论】:

【参考方案3】:

Google BigQuery 属于技术堆栈的“大数据即服务”类别,而 Google Cloud Storage 可以主要归类为“Cloud Storage”。

Google BigQuery 提供的一些功能包括:

• 所有幕后工作 - 您的查询可以在 背景,并且可以轮询状态。

• 轻松导入数据 - 使用 Google Cloud Storage 批量加载数据或以每秒高达 1,000 行的突发速度流式传输数据。

• 负担得起的大数据 - 每个月处理的第一个 TB 数据是免费的。

另一方面,Google Cloud Storage 提供以下主要功能:

• 高容量和可扩展性

• 强大的数据一致性

• 谷歌开发者控制台项目

“高性能”是开发人员认为 Google BigQuery 胜过竞争对手的主要原因,而“可扩展”则被认为是选择 Google Cloud Storage 的关键因素。

【讨论】:

以上是关于BigQuery 和 GCP 上的存储有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章

GCP端点和Apigee有啥区别

GCP 中的 KMS 和秘密管理器有啥区别?

Google Cloud Spanner 和 Cloud SQL 有啥区别?

GCP 中的网络和 HTTP(s) 负载平衡器有啥区别

GCP Dataflow- 从存储中读取 CSV 文件并写入 BigQuery

使用 apache beam 中的 beam.io.gcp.bigquery.WriteToBigQuery 模块写入日期分区的 Bigquery 表