在 MySQL 查询中按随机混合的记录排序
Posted
技术标签:
【中文标题】在 MySQL 查询中按随机混合的记录排序【英文标题】:Order by records with random mix in MySQL queries 【发布时间】:2013-07-13 16:47:24 【问题描述】:我正在从我对 mysql 数据库的查询中寻找一种特殊的要求,我想以不同的方式应用 order by。例如。在具有字段 user_id 和 user_rating 和 user_department 的数据库中包含以下数据。
+------------------------------------------------------+
| user_id | user_rating | user_department |
+------------------------------------------------------+
| 1 | 102 | A |
| 2 | 33 | B |
| 3 | 43 | C |
| 4 | 54 | A |
| 5 | 63 | A |
| 6 | 214 | B |
| 7 | 82 | A |
| 8 | 87 | C |
| 9 | 43 | A |
| 10 | 98 | A |
| 11 | 73 | C |
| 12 | 31 | A |
+------------------------------------------------------+
鉴于上述结构,我想按 each_department 的 user_rating 顺序对结果进行排序,并且我需要每个 user_department 中最多 5 条记录,其中初始 3 条记录应该是按照他们的评分顺序,但其余 2 应该是随机的。
所以在上述情况下,输出将类似于:
+------------------------------------------------------+
| user_id | user_rating | user_department |
+------------------------------------------------------+
| 1 | 102 | A |
| 10 | 98 | A |
| 7 | 82 | A |
| 12 | 31 | A |
| 5 | 63 | A |
| 6 | 214 | B |
| 2 | 33 | B |
| 8 | 87 | C |
| 11 | 73 | C |
| 3 | 43 | C |
+------------------------------------------------------+
我尝试了通过网络提供的用于自定义排序的选项,例如使用 FIELD 功能,但在这里找不到那么有用。还尝试使用子查询来解决它,但该选项看起来也不可行,因为 MySql 不允许我在查询中同时使用 IN 和 LIMIT 关键字。
有没有更好/更简单的方法来解决这个问题。
【问题讨论】:
在您的上下文中,运行一系列 SQL 是否可行。例如。为每个部门创建一个具有前三名的临时表,然后运行另一个从每个部门随机包含 2 个但尚未存在于临时表中的临时表? 是的,可以做到,对于第二次查询,应在第一次查询后剩余的记录中选择随机记录。 【参考方案1】:这不是您正在寻找的,但它提供了一种方法。
这个想法是使用group_concat()
将每个部门的前 5 个值放在一个列中。此列具有以下形式:
user_id:rating
最多重复五次,以逗号分隔。如:
1:182,10:98,7:82,12:31,5:63
执行此操作的查询是:
select user_department,
substring_index(group_concat(concat(user_id, ':', user_rating)
order by user_rating desc
), ',', 5)
from t
group by user_department;
这不处理最后两个值的随机化。它把所有东西放在一排。但是,我认为这可能会有所帮助。
我的下一次尝试技术上按照你的要求做,但它冒着最后两个“随机”用户可能相同的风险。
它使用上面相同的group_concat()
技巧。但是,它通过从列表中选择不同的值来超越这一点,使用substring_index()
:
select u.user_id, user_id.user_rating, u.user_department
from (select (case when n.n in (1, 2, 3) or ud.numusers <= 5
then cast(substring_index(substring_index(users, ',', n.n), ',', -1) as unsigned)
else CAST(substring_index(substring_index(users, ',', 4 + rand()*(num_users - 3)), ',', -1) as unsigned)
end) as user_id
from (select user_department,
group_concat(user_id order by user_rating desc) as users,
count(*) as numusers
from t
group by user_department
) ud join
(select 1 as n union all select 2 union all select 3 union all select 4 union all select 5
) n
on n.n <= ud.numusers
) u join
t
on u.user_id = t.user_id
order by user_department, user_rating desc
【讨论】:
感谢您的回复。是的,它看起来很有用。对我来说,主要问题是将第二个要求合并到第一个查询中,因为它应该应用于剩余的记录。以上是关于在 MySQL 查询中按随机混合的记录排序的主要内容,如果未能解决你的问题,请参考以下文章