从多列中选择最小值的最佳方法是什么?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从多列中选择最小值的最佳方法是什么?相关的知识,希望对你有一定的参考价值。
给出SQL Server 2005中的下表:
ID Col1 Col2 Col3
-- ---- ---- ----
1 3 34 76
2 32 976 24
3 7 235 3
4 245 1 792
编写产生以下结果的查询的最佳方法是什么(即产生最终列的查询 - 包含每行的Col1,Col2和Col3中的minium值的列)?
ID Col1 Col2 Col3 TheMin
-- ---- ---- ---- ------
1 3 34 76 3
2 32 976 24 24
3 7 235 3 3
4 245 1 792 1
更新:
为了澄清(正如我在演讲中所说),在真实场景中,数据库已正确规范化。这些“数组”列不在实际表中,而是在报表中所需的结果集中。新要求是报告还需要此MinValue列。我无法更改基础结果集,因此我期待T-SQL获得一个方便的“走出监狱卡”。
我尝试了下面提到的CASE方法并且它有效,尽管它有点麻烦。它也比答案中说明的更复杂,因为你需要满足同一行中有两个最小值的事实。
无论如何,我想我会发布我目前的解决方案,鉴于我的限制,它的效果非常好。它使用UNPIVOT运算符:
with cte (ID, Col1, Col2, Col3)
as
(
select ID, Col1, Col2, Col3
from TestTable
)
select cte.ID, Col1, Col2, Col3, TheMin from cte
join
(
select
ID, min(Amount) as TheMin
from
cte
UNPIVOT (Amount for AmountCol in (Col1, Col2, Col3)) as unpvt
group by ID
) as minValues
on cte.ID = minValues.ID
我会提前说我不希望这提供最好的性能,但考虑到情况(我无法重新设计所有查询只是为了新的MinValue列要求),它是一个非常优雅的“走出监狱卡”。
可能有很多方法可以实现这一目标。我的建议是使用Case / When来做。有3列,它不是太糟糕。
Select Id,
Case When Col1 < Col2 And Col1 < Col3 Then Col1
When Col2 < Col1 And Col2 < Col3 Then Col2
Else Col3
End As TheMin
From YourTableNameHere
this question和this question都试图回答这个问题。
回顾一下,Oracle有一个内置函数,对于Sql Server,您要么定义用户定义函数,要么使用case语句。
如果你能够创建一个存储过程,它可能需要一组值,你可以调用它。
select *,
case when column1 < columnl2 And column1 < column3 then column1
when columnl2 < column1 And columnl2 < column3 then columnl2
else column3
end As minValue
from tbl_example
联合查询有点扭曲:
DECLARE @Foo TABLE (ID INT, Col1 INT, Col2 INT, Col3 INT)
INSERT @Foo (ID, Col1, Col2, Col3)
VALUES
(1, 3, 34, 76),
(2, 32, 976, 24),
(3, 7, 235, 3),
(4, 245, 1, 792)
SELECT
ID,
Col1,
Col2,
Col3,
(
SELECT MIN(T.Col)
FROM
(
SELECT Foo.Col1 AS Col UNION ALL
SELECT Foo.Col2 AS Col UNION ALL
SELECT Foo.Col3 AS Col
) AS T
) AS TheMin
FROM
@Foo AS Foo
如果你使用SQL 2005,你可以做这样的事情:
;WITH res
AS ( SELECT t.YourID ,
CAST(( SELECT Col1 AS c01 ,
Col2 AS c02 ,
Col3 AS c03 ,
Col4 AS c04 ,
Col5 AS c05
FROM YourTable AS cols
WHERE YourID = t.YourID
FOR
XML AUTO ,
ELEMENTS
) AS XML) AS colslist
FROM YourTable AS t
)
SELECT YourID ,
colslist.query('for $c in //cols return min(data($c/*))').value('.',
'real') AS YourMin ,
colslist.query('for $c in //cols return avg(data($c/*))').value('.',
'real') AS YourAvg ,
colslist.query('for $c in //cols return max(data($c/*))').value('.',
'real') AS YourMax
FROM res
这样你就不会迷失在这么多运营商中:)
但是,这可能比其他选择慢。
这是你的选择...
下面我使用临时表来获得最少的几个日期。第一个临时表查询几个连接表以获取各种日期(以及查询的其他值),然后第二个临时表使用与日期列一样多的遍数获取各个列和最小日期。
这基本上类似于联合查询,需要相同数量的传递,但可能更有效(基于经验,但需要测试)。在这种情况下,效率不是问题(8,000条记录)。可以指数等
--==================== this gets minimums and global min
if object_id('tempdb..#temp1') is not null
drop table #temp1
if object_id('tempdb..#temp2') is not null
drop table #temp2
select r.recordid , r.ReferenceNumber, i.InventionTitle, RecordDate, i.ReceivedDate
, min(fi.uploaddate) [Min File Upload], min(fi.CorrespondenceDate) [Min File Correspondence]
into #temp1
from record r
join Invention i on i.inventionid = r.recordid
left join LnkRecordFile lrf on lrf.recordid = r.recordid
left join fileinformation fi on fi.fileid = lrf.fileid
where r.recorddate > '2015-05-26'
group by r.recordid, recorddate, i.ReceivedDate,
r.ReferenceNumber, i.InventionTitle
select recordid, recorddate [min date]
into #temp2
from #temp1
update #temp2
set [min date] = ReceivedDate
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.ReceivedDate < [min date] and t1.ReceivedDate > '2001-01-01'
update #temp2
set [min date] = t1.[Min File Upload]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.[Min File Upload] < [min date] and t1.[Min File Upload] > '2001-01-01'
update #temp2
set [min date] = t1.[Min File Correspondence]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.[Min File Correspondence] < [min date] and t1.[Min File Correspondence] > '2001-01-01'
select t1.*, t2.[min date] [LOWEST DATE]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
order by t1.recordid
对于多列,最好使用CASE语句,但是对于两个数字列i和j,您可以使用简单的数学:
min(i,j)=(i + j)/ 2 - abs(i-j)/ 2
这个公式可以用来获得多列的最小值,但是它真的很乱过去2,min(i,j,k)将是min(i,min(j,k))
SELECT [ID],
(
SELECT MIN([value].[MinValue])
FROM
(
VALUES
([Col1]),
([Col1]),
([Col2]),
([Col3])
) AS [value] ([MinValue])
) AS [MinValue]
FROM Table;
如果您知道要查找的值,通常是状态代码,以下内容可能会有所帮助:
select case when 0 in (PAGE1STATUS ,PAGE2STATUS ,PAGE3STATUS,
PAGE4STATUS,PAGE5STATUS ,PAGE6STATUS) then 0 else 1 end
FROM CUSTOMERS_FORMS
我知道这个问题已经过时了,但我仍然需要答案,并且不满意其他答案,所以我不得不设计自己的,这是@ paxdiablo的answer的一个转折。
我来自SAP ASE 16.0,我只需要查看某些数据的统计数据,这些数据是有效存储在单行不同列中的恕我直言(它们代表不同的时间 - 当计划到达时,它是预期的行动开始,最后是什么时间)。因此,我将列转换为临时表的行,并通常对此进行查询。
注:不是一刀切的解决方案!
CREATE TABLE #tempTable (ID int, columnName varchar(20), dataValue int)
INSERT INTO #tempTable
SELECT ID, 'Col1', Col1
FROM sourceTable
WHERE Col1 IS NOT NULL
INSERT INTO #tempTable
SELECT ID, 'Col2', Col2
FROM sourceTable
WHERE Col2 IS NOT NULL
INSERT INTO #tempTable
SELECT ID, 'Col3', Col3
FROM sourceTable
WHERE Col3 IS NOT NULL
SELECT ID
, min(dataValue) AS 'Min'
, max(dataValue) AS 'Max'
, max(dataValue) - min(dataValue) AS 'Diff'
FROM #tempTable
GROUP BY ID
在630000行的源集上花了大约30秒并且只使用了索引数据,所以不是在时间关键的过程中运行的东西,而是像一次性数据检查或日终报告那样你可能会很好(但请与您的同事或上司核实一下!)。对我来说,这种风格的主要好处是我可以随时使用更多/更少的列并更改分组,过滤等,特别是在复制数据后。
额外的数据(columnName
,max
es,......)是为了帮助我进行搜索,所以你可能不需要它们;我把它们留在这里可能引发一些想法:-)。
使用CROSS APPLY
:
SELECT ID, Col1, Col2, Col3, MinValue
FROM YourTable
CROSS APPLY (SELECT MIN(d) MinValue FROM (VALUES (Col1), (Col2), (Col3)) AS a(d)) A
SELECT ID, Col1, Col2, Col3,
(SELECT MIN(Col) FROM (VALUES (Col1), (Col2), (Col3)) AS X(Col)) AS TheMin
FROM Table
您可以使用“强力”方法进行扭曲:
SELECT CASE
WHEN Col1 <= Col2 AND Col1 <= Col3 THEN Col1
WHEN Col2 <= Col3 THEN Col2
ELSE Col3
END AS [Min Value] FROM [Your Table]
当第一个条件失败时,它保证Col1不是最小值,因此您可以从其他条件中消除它。同样适用于后续条件。对于五列,您的查询将变为:
SELECT CASE
WHEN Col1 <= Col2 AND Col1 <= Col3 AND Col1 <= Col4 AND Col1 <= Col5 THEN Col1
WHEN Col2 <= Col3 AND Col2 <= Col4 AND Col2 <= Col5 THEN Col2
WHEN Col3 <= Col4 AND Col3 <= Col5 THEN Col3
WHEN 以上是关于从多列中选择最小值的最佳方法是什么?的主要内容,如果未能解决你的问题,请参考以下文章
从 Groovy 中的 Set 中提取单个值的最佳方法是啥?