Google BigQuery 定价
Posted
技术标签:
【中文标题】Google BigQuery 定价【英文标题】:Google BigQuery pricing 【发布时间】:2013-09-16 17:48:45 【问题描述】:我是新加坡管理大学的博士生。目前我正在卡内基梅隆大学从事一个研究项目,该项目需要来自 Github Archive (http://www.githubarchive.org/) 的历史事件。我注意到 Google Bigquery 有 Github Archive 数据。所以我运行了一个程序来使用 Google Bigquery 服务来抓取数据。
我刚刚发现控制台上的谷歌bigquery节目的价格不是实时更新的...虽然我开始运行程序几个小时,费用只有4美元加,所以我认为价格是合理的,我一直在运行程序。 1~2天后,我在2013年9月13日再次查看价格,价格变为1388美元......因此我立即停止使用Google bigquery服务。而刚才我又查了一下价格,原来我需要付4179$...
我没有意识到我需要花这么多钱来执行查询和从 Google bigquery 获取数据是我的错。
本项目仅用于研究,不用于商业目的。我想知道是否可以免除费用。我真的需要 [Google Bigquery 团队] 的帮助。
非常感谢您和最诚挚的问候, 丽莎
【问题讨论】:
联系谷歌支持并向他们解释情况。虽然您应该在使用/注册服务之前阅读使用条款和费用。 是的..我知道这是我的错。 :( 另外,我不知道 Google Bigquery 控制台中显示的 Bigquery 资源使用情况和价格不是实时的。 Google Bigquery 团队不提供任何支持联系电话。我可以知道如何联系他们吗?提前致谢。 您好,龚伟,我在 BigQuery 团队工作。我会离线联系你,以便我们解决这个问题。 我投票结束这个问题,因为我们不是谷歌的客户服务。 Why can't I ask customer service-related questions? 【参考方案1】:一年后更新:
请注意自这种情况以来的一些重大发展:
查询价格下降 85%。 GithubArchive 现在发布每日和每年的表格 - 因此,在开发查询时,请始终在较小的数据集上测试它们。BigQuery 定价基于查询的数据量。它的一大亮点是它的扩展性,从几千兆字节扫描到几兆兆字节。
线性定价是一个特点:我知道的大多数(或全部?)其他数据库将需要成倍增加的资源,或者只是无法处理这些数据量 - 至少不能在合理的时间范围内。
也就是说,线性扩展意味着 TB 上的查询比 GB 上的查询贵 1000 倍。 BigQuery 用户需要意识到这一点并做出相应的计划。出于这些目的,BigQuery 提供了“试运行”标志,它允许人们在运行查询之前准确查看将查询多少数据 - 并进行相应调整。
在这种情况下,WeiGong 正在查询一个 105 GB 的表。十个SELECT * LIMIT 10
查询将很快达到 1 TB 的数据量,以此类推。
有一些方法可以使这些相同的查询消耗更少的数据:
不要查询SELECT * LIMIT 10
,而是只调用您要查找的列。 BigQuery 根据您查询的列收费,因此拥有不必要的列会增加不必要的成本。
例如,SELECT * ...
查询 105 GB,而 SELECT repository_url, repository_name, payload_ref_type, payload_pull_request_deletions FROM [githubarchive:github.timeline]
仅查询 8.72 GB,这使得此查询的成本降低了 10 倍以上。
查找下载整个表时,请使用 tabledata.list 而不是“SELECT *”。它是免费的。
Github 存档表包含所有时间的数据。如果您只想查看 1 个月的数据,请对其进行分区。
例如,使用查询提取一月份的所有数据会留下一个只有 91.7 MB 的新表。查询这张表比大表便宜一千倍!
SELECT *
FROM [githubarchive:github.timeline]
WHERE created_at BETWEEN '2014-01-01' and '2014-01-02'
-> save this into a new table 'timeline_201401'
结合使用这些方法,您可以从 4000 美元的钞票变成 4 美元的钞票,并获得同样数量的快速和有洞察力的结果。
(我正在与 Github 存档的所有者合作,让他们存储每月数据,而不是一个单一的表,以使这更容易)
【讨论】:
以上是关于Google BigQuery 定价的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Dataproc 删除 BigQuery 表不起作用
如何在 Google BigQuery 的记录中查询字符串?文档不工作
BigQuery AEAD 功能的密钥集管理最佳实践 [关闭]