根据条件从多个表中获取数据

Posted

技术标签:

【中文标题】根据条件从多个表中获取数据【英文标题】:Get data from multiple tables based on condition 【发布时间】:2020-09-24 11:13:56 【问题描述】:

我需要从 3 个不同的 mysql 表中获取一些数据,如下所示。

 +-----------------------------------+      
 | Questions                         |      
 -------------------------------------      
 | id: int(8)                        |      
 | -- data we don't care about here  |      
 | question: TEXT                    |      
 +-----------------------------------+    

 +--------------------------+               
 |Answers                   |               
 +--------------------------+               
 | id: int(8)               |               
 | -- other data            |               
 | answer: TEXT             |               
 +--------------------------+    

 +-----------------------------------+      
 |Votes                              |      
 +-----------------------------------+      
 | id: int(8)                        |      
 | step: tinyint(1)                  |      
 | answerId: int(8)                  |      
 +-----------------------------------+      

我需要获得对每个问题的投票最多的答案以及该答案的票数。

我能想到的最好的查询是:

SELECT question, answer, count(votes.id) votesCount FROM questions INNER JOIN answers ON questions.id = answers.questionId INNER JOIN votes ON answers.id = votes.answerId;

但是这是错误的,因为它总是返回一个包含第一个问题、随机答案和总票数的结果。

【问题讨论】:

【参考方案1】:

您的直接问题是您的查询缺少group by 子句。所以它只返回一行,包括总票数和任意选择的问题和答案。

如果您运行的是 MySQL 8.0,这可以通过聚合和窗口函数轻松完成:

select question, answer, votescount
from (
    select 
        q.question, 
        a.answer, 
        count(*) votescount,
        rank() over(partition by q.id order by count(*) desc) rn
    from questions q
    inner join answers a on q.id = a.questionid 
    inner join votes on a.id = v.answerid
    group by q.id, q.question, a.id, a.answer
) t
where rn = 1

在早期版本中,它有点复杂。一种选择是使用 having 子句过滤聚合结果集,该子句返回每个组的最高计数:

select 
    q.question, 
    a.answer, 
    count(*) votescount,
    rank() over(partition by q.id order by count(*) desc) rn
from questions q
inner join answers a on q.id = a.questionid 
inner join votes on a.id = v.answerid
group by q.id, q.question, a.id, a.answer
having count(*) = (
    select count(*)
    from answers a1
    inner join votes v1 a1.id = v1.answerid
    where a1.questionid = q.id
    group by a1.id
    order by count(*) desc
    limit 1
)

【讨论】:

我使用的是最新版本的 mysql,所以这可以工作,但是有一个问题,如果一个问题的两个答案具有相同的票数,则返回两个结果而不是 1 @thelmuxkriovar:是的,rank() 就是这样做的。如果有平局,你想要哪个答案? id最低的那个 @thelmuxkriovar:好的,所以row_number() over(partition by q.id order by count(*) desc, a.id)(我们可以使用相同的rank(),但row_number() 明确表示我们不想要联系)。 行得通!非常感谢,您能否编辑您的答案以包含该内容?

以上是关于根据条件从多个表中获取数据的主要内容,如果未能解决你的问题,请参考以下文章

Excel - UDF 函数,用于根据条件从多个工作表中获取 SUM 值

用于从具有多个条件的多个表中的多个列中获取数据的存储过程

如何在 laravel 中使用查询生成器根据 id 从多个表中获取数据

Laravel Eloquent 关系 - 不根据条件获取

如何从多个表中获取记录?

使用 sql,spark 根据某些条件从表中获取输出