BigQuery 和 GCP 上的存储有啥区别?
Posted
技术标签:
【中文标题】BigQuery 和 GCP 上的存储有啥区别?【英文标题】:what is the difference between BigQuery and Storage on GCP?BigQuery 和 GCP 上的存储有什么区别? 【发布时间】:2021-02-24 21:35:52 【问题描述】:大家好,我是第一次使用 GCP,当我使用模拟数据浏览项目的云功能示例时,我对每个项目的相似之处/不同之处感到困惑,我想更清楚地了解它们的不同之处因为在我看来它们是如此相似。
【问题讨论】:
你觉得有什么相似之处? 【参考方案1】:BigQuery 是一个数据仓库和一个 SQL 引擎。您可以使用它将表格数据存储在数据集和表中。在表中,您还可以存储更复杂的结构,例如数组和 JSON,但不能存储文件。
Cloud Storage 是一个 blob 存储,其功能类似于您在 linux/windows 机器中所知道的功能(保存文件、文件夹、删除、复制)。当然,在后端它与您的本地文件系统完全不同。
【讨论】:
【参考方案2】:BigQuery
是一个完全托管的无服务器数据仓库。就像Snowflake
或Redshift
。
Google Cloud Storage(GCS)
类似于 Amazon S3
或 Azure Storage
。顾名思义,存储就是用来存储数据的。
您通常使用BigQuery
来分析和查询数据以得出一些见解。 BigQuery
是一个分析引擎。
GCS(Google Cloud Storage)
可以存储图片、视频、日志、文件等,BigQuery
不行。
【讨论】:
【参考方案3】:Google BigQuery 属于技术堆栈的“大数据即服务”类别,而 Google Cloud Storage 可以主要归类为“Cloud Storage”。
Google BigQuery 提供的一些功能包括:
• 所有幕后工作 - 您的查询可以在 背景,并且可以轮询状态。
• 轻松导入数据 - 使用 Google Cloud Storage 批量加载数据或以每秒高达 1,000 行的突发速度流式传输数据。
• 负担得起的大数据 - 每个月处理的第一个 TB 数据是免费的。
另一方面,Google Cloud Storage 提供以下主要功能:
• 高容量和可扩展性
• 强大的数据一致性
• 谷歌开发者控制台项目
“高性能”是开发人员认为 Google BigQuery 胜过竞争对手的主要原因,而“可扩展”则被认为是选择 Google Cloud Storage 的关键因素。
【讨论】:
以上是关于BigQuery 和 GCP 上的存储有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Spanner 和 Cloud SQL 有啥区别?
GCP Dataflow- 从存储中读取 CSV 文件并写入 BigQuery
使用 apache beam 中的 beam.io.gcp.bigquery.WriteToBigQuery 模块写入日期分区的 Bigquery 表