相关子查询的解决方法

Posted

技术标签:

【中文标题】相关子查询的解决方法【英文标题】:Workaround for a correlated subquery 【发布时间】:2021-09-14 19:59:16 【问题描述】:

我需要在不使用相关子查询的情况下运行以下连接,因为我被限制为使用 Hive 或 Presto,由于我使用了相关子查询,这两种方法都失败了。

我已将其简化为 MWE。我有一张每个用户及其 18 岁生日的表格。每次每个用户访问电影院时,我都有另一张表。我只想在用户最后一次访问我的电影院时合并。下面是适用于本机 SQL 的代码。

什么是最有效的解决方法,不需要我加入访问电影院的用户的每个实例(它太大了)。

SELECT
    people.*,
    tickets.uid
    tickets.date
FROM all_customers as people
JOIN tkting as tickets
    on people.uid = tickets.uid
    and tickets.date = (select
                            lastvisit.date
                        from tickets as lastvisit
                        where
                            lastvisit.uid = people.uid
                            and lastvisit.date < people.birthday_18
                        order by lastvisit.date asc
                        limit 1)

【问题讨论】:

【参考方案1】:

代替这个内部查询:

SELECT lastvisit.date
...
ORDER BY lastvisit.date ASC
LIMIT 1

你可以试试:

SELECT min(lastvisit.date)
...

【讨论】:

以上是关于相关子查询的解决方法的主要内容,如果未能解决你的问题,请参考以下文章

如何减少许多相似的相关子查询?

关于Hive中case when不准使用子查询的解决方法

数据库分片分库常见问题解决方案

MySQL子查询

ORA-01427 单行子查询返回多行 - 如何解决?

mysql不支持在子查询中使用limit解决办法