基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT

Posted 2023-03-31

技术标签:

【中文标题】基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT【英文标题】：Benchmark Amazon Redshift JSON_EXTRACT_PATH_TEXT 【发布时间】：2014-11-25 08:55:30 【问题描述】：

谁能帮助我进行红移 JSON_EXTRACT_PATH_TEXT 的基准测试/性能统计功能？

对于海量数据提取json数据（约5000万），我们是否应该使用此功能？

【问题讨论】：

嗯，所以亚马逊已经将 PostgreSQL 的 json 函数移植到 Reshift（或者更确切地说，ParAccel）。很难说它们的表现如何......我认为您可能只需要自己进行基准测试。 @CraigRinger 您可以在此处查看详细信息：docs.aws.amazon.com/redshift/latest/dg/… Redshift 还支持 JSON_ARRAY_LENGTH JSON_EXTRACT_ARRAY_ELEMENT_TEXT。 【参考方案1】：

5000 万对于 redshift 来说是小菜一碟，但提取 json 内容肯定比普通列中的任何内容都慢。

在 24xdc1.large 集群上

2.3B 行

select count(*) from table where json_extract_path_text(what_extra_json, 'is_logged_in') is not null;

计数

1364239102 (1 行)

24 秒后

【讨论】：

以上是关于基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT的主要内容，如果未能解决你的问题，请参考以下文章

amazon-redshift 中的 CONCAT 函数

Amazon Redshift 按特定值排序

不使用 jdbc 驱动程序查询 Amazon Redshift

有用的 Amazon Redshift SQL 用户定义函数的任何示例？

与 Amazon Redshift 同步

将数据从 Amazon redshift 卸载到 Amazon s3