联合所有但只保留 T-SQL 中一张表的重复项
Posted
技术标签:
【中文标题】联合所有但只保留 T-SQL 中一张表的重复项【英文标题】:Union All but keep only duplicates from one table in T-SQL 【发布时间】:2021-05-28 11:33:35 【问题描述】:我有两张表要合并。我只需要保留两个表之一的重复项。我试图找到它,但在任何地方都找不到。希望有人能帮忙。
例如: 表_1:
ID | Product | Amount |
---|---|---|
1 | A | 10 |
2 | B | 10 |
3 | C | 10 |
表_2:
ID | Product | Amount |
---|---|---|
3 | C | 9 |
4 | A | 100 |
5 | B | 100 |
想要的结果:
ID | Product | Amount |
---|---|---|
1 | A | 10 |
2 | B | 10 |
3 | C | 9 |
4 | A | 100 |
5 | B | 100 |
因此,请始终使用 table_2 中的重复项。在这个例子中,ID 3 是重复的,所以使用 table_2 的副本,数量为 9。
如何用 T-SQL 实现这一点?我使用了下面的代码:
Select * from Table_1 where Table_1.id != Table_2.id
Union All
Select * from Table_2
但随后我收到错误消息: '无法绑定多部分标识符“Table_2.ID”。'
【问题讨论】:
看我的回答。这个概念非常直接,因为当我们需要两个表的不同行时,我们使用联合。当我们使用所有记录时,我们使用 Union all。 还有什么比:***.com/a/67740103/8483417更简单的 【参考方案1】:使用not exists
:
Select t1.*
from Table_1 t1
where not exists (select 1 from table_2 t2 where t2.id = t1.id)
Union All
Select t2.*
from Table_2 t2;
【讨论】:
【参考方案2】:试试这个:
SELECT T1.*
FROM @Table1 T1
WHERE T1.ID NOT IN (SELECT ID FROM @Table2)
UNION
SELECT T2.*
FROM @Table2 T2
【讨论】:
还有一个问题,如果我需要添加一列来计算每个产品的数量?产品的金额/计数总和(对于 A,它是 (100 + 10) / 2 )如何将其包装在 T-SQL 中? 选择产品,数量 = SUM(1),金额 = SUM(Amount) FROM (***) GROUP BY Product。在括号之间,将 *** 替换为先前的答案/脚本。 @xris23 你最好使用UNION ALL
而不是UNION
(其他答案证明了这一点)。 UNION
隐式地将DISTINCT
应用于最终数据集,这会带来性能成本,【参考方案3】:
我假设你想要的是EXISTS
:
SELECT T1.ID,
T1.Product,
T1.Amount
FROM dbo.Table1 T1
WHERE NOT EXISTS (SELECT 1
FROM dbo.Table2 T2
WHERE T1.ID = T2.ID)
UNION ALL
SELECT T2.ID,
T2.Product,
T2.Amount
FROM dbo.Table2 T2;
不过,FULL OUTER JOIN
也可以工作如果ID
在两个表中都是唯一的:
SELECT ISNULL(T2.ID,T1.ID) AS ID,
ISNULL(T2.Product,T1.Product) AS Product,
ISNULL(T2.Amount,T1.Amount) AS Amount
FROM dbo.Table1 T1
FULL OUTER JOIN dbo.Table2 T2 ON T1.ID = T2.ID;
【讨论】:
【参考方案4】:Union 会给你结果。 Union 将始终返回唯一值。如果你使用 union all 你会得到所有的重复。您的答案是使用 union all。
SELECT
B.ID
,B.Product
,B.Amount
FROM
(
SELECT
A.ID
,A.Product
,A.Amount
,ROW_NUMBER() over (Partition BY ID, Product order by Amount ASC) AS [row_num]
FROM
(
SELECT
tb_1.*
FROM tb_1
UNION ALL
SELECT
tb_2.*
FROM tb_2
) AS A
) AS B
WHERE B.[row_num] = 1
【讨论】:
以上是关于联合所有但只保留 T-SQL 中一张表的重复项的主要内容,如果未能解决你的问题,请参考以下文章