基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT
Posted
技术标签:
【中文标题】基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT【英文标题】:Benchmark Amazon Redshift JSON_EXTRACT_PATH_TEXT 【发布时间】:2014-11-25 08:55:30 【问题描述】:谁能帮助我进行红移 JSON_EXTRACT_PATH_TEXT 的基准测试/性能统计 功能?
对于海量数据提取json数据(约5000万),我们是否应该使用此功能?
【问题讨论】:
嗯,所以亚马逊已经将 PostgreSQL 的 json 函数移植到 Reshift(或者更确切地说,ParAccel)。很难说它们的表现如何......我认为您可能只需要自己进行基准测试。 @CraigRinger 您可以在此处查看详细信息:docs.aws.amazon.com/redshift/latest/dg/… Redshift 还支持 JSON_ARRAY_LENGTH JSON_EXTRACT_ARRAY_ELEMENT_TEXT。 【参考方案1】:5000 万对于 redshift 来说是小菜一碟,但提取 json 内容肯定比普通列中的任何内容都慢。
在 24xdc1.large 集群上
2.3B 行
select count(*) from table where json_extract_path_text(what_extra_json, 'is_logged_in') is not null;
计数
1364239102 (1 行)
24 秒后
【讨论】:
以上是关于基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT的主要内容,如果未能解决你的问题,请参考以下文章
不使用 jdbc 驱动程序查询 Amazon Redshift