将“SELECT TOP (1) WITH TIES”转换为 EF Core

Posted

技术标签:

【中文标题】将“SELECT TOP (1) WITH TIES”转换为 EF Core【英文标题】:Converting `SELECT TOP (1) WITH TIES` to EF Core 【发布时间】:2021-12-25 19:13:02 【问题描述】:

T-SQL 版本的查询

让我们用一些数据建立一个简单的表格:

DROP TABLE IF EXISTS #OrdersTable

CREATE TABLE #OrdersTable
(
    Id int,
    Custid int
);

INSERT INTO #OrdersTable (Id, Custid) VALUES (1, 71);
INSERT INTO #OrdersTable (Id, Custid) VALUES (2, 71);
INSERT INTO #OrdersTable (Id, Custid) VALUES (3, 71);
INSERT INTO #OrdersTable (Id, Custid) VALUES (4, 72);
INSERT INTO #OrdersTable (Id, Custid) VALUES (5, 72);
INSERT INTO #OrdersTable (Id, Custid) VALUES (6, 72);
INSERT INTO #OrdersTable (Id, Custid) VALUES (7, 73);
INSERT INTO #OrdersTable (Id, Custid) VALUES (8, 74);
INSERT INTO #OrdersTable (Id, Custid) VALUES (9, 74);

在这种情况下,客户 71 和 72 各有 3 个订单。客户 73 有 1 个订单。客户 74 有 2 个订单。

假设我们想了解订单数量最多的客户。

以下查询:

SELECT TOP (1) WITH TIES Custid
FROM #OrdersTable
GROUP BY Custid
ORDER BY COUNT(*) DESC;

结果如下:

Custid
-----------
71
72

(2 rows affected)

到 EF Core 的朴素转换

给定以下类:

public class Order

    public int Id  get; set; 
    public int Custid  get; set; 

以及以下数据:

var OrdersTable = new List<Order>()

    new Order() Id = 1, Custid = 71,
    new Order() Id = 2, Custid = 71,
    new Order() Id = 3, Custid = 71,
    new Order() Id = 4, Custid = 72,
    new Order() Id = 5, Custid = 72,
    new Order() Id = 6, Custid = 72,
    new Order() Id = 7, Custid = 73,
    new Order() Id = 8, Custid = 74,
    new Order() Id = 9, Custid = 74,
;

这是查询到 EF Core 的简单转换:

var n = OrdersTable.GroupBy(order => order.Custid).Select(grouping => grouping.Count()).Max();

var custids = OrdersTable.GroupBy(order => order.Custid).Where(grouping => grouping.Count() == n).Select(grouping => grouping.Key);

使用以下方式显示数据:

foreach (var custid in custids)
    Console.WriteLine(custid);

我们得到:

71
72

问题

让我们将 T-SQL 和 EF Core 版本并排放置。 T-SQL:

SELECT TOP (1) WITH TIES Custid
FROM #OrdersTable
GROUP BY Custid
ORDER BY COUNT(*) DESC;

EF 核心:

var n = OrdersTable.GroupBy(order => order.Custid).Select(grouping => grouping.Count()).Max();

var custids = OrdersTable.GroupBy(order => order.Custid).Where(grouping => grouping.Count() == n).Select(grouping => grouping.Key);

我的问题是,有没有更有效的方法在 EF Core 中实现这个查询?

完整程序

演示上述查询的完整 C# 控制台程序:

using System;
using System.Collections.Generic;
using System.Linq;

namespace EfCoreTop1Ties

    public class Order
    
        public int Id  get; set; 
        public int Custid  get; set; 
    

    internal class Program
    
        static void Main(string[] args)
        
            var OrdersTable = new List<Order>()
            
                new Order() Id = 1, Custid = 71,
                new Order() Id = 2, Custid = 71,
                new Order() Id = 3, Custid = 71,
                new Order() Id = 4, Custid = 72,
                new Order() Id = 5, Custid = 72,
                new Order() Id = 6, Custid = 72,
                new Order() Id = 7, Custid = 73,
                new Order() Id = 8, Custid = 74,
                new Order() Id = 9, Custid = 74,
            ;

            var n = OrdersTable.GroupBy(order => order.Custid).Select(grouping => grouping.Count()).Max();

            var custids = OrdersTable.GroupBy(order => order.Custid).Where(grouping => grouping.Count() == n).Select(grouping => grouping.Key);

            foreach (var custid in custids)
                Console.WriteLine(custid);
        
    

【问题讨论】:

可能值得指出的是,EF 核心可以使用原始 SQL 作为实体集的源,甚至可以在它们之上编写更多查询 【参考方案1】:

您应该能够通过一个查询来做到这一点:

var n = OrdersTable
    .GroupBy(order => order.Custid)
    .Select(grouping => new  CustomerId = grouping.Key, OrderCount = grouping.Count() )
    .OrderByDescending(g => g.OrderCount)
    .ToList();

var maxCount = n.First().OrderCount;
var custIds = n.Where(g => g.OrderCount == maxCount)
    .Select(g => g.CustomerId)
    .ToList();

在 OrdersTable 是 DbContext DBSet 的情况下,这将导致对数据库进行 1 次查询。与该计数匹配的返回项目的检查是在内存中从结果中完成的,无需返回。

如果您正在处理一个特别大的数据集,您可以考虑一些合理的假设,例如,如果有成千上万的客户,那么 100 或 1000 可能会与最大的订单“平局”。

var n = OrdersTable
    .GroupBy(order => order.Custid)
    .Select(grouping => new  CustomerId = grouping.Key, OrderCount = grouping.Count() )
    .OrderByDescending(g => g.OrderCount)
    .Take(100)
    .ToList();

if (n.All(g => g.OrderCount == n.First().OrderCount)
   // Redo query with larger threshold.

如果所有返回的行恰好具有相同的订单计数,它将再次运行查询。您可能希望以不同的方式处理这种情况,例如当所有客户都有 0 个订单时。 (如果您有选择要比较的客户的标准,例如每个城市/州等)

如果要覆盖一个非常大的数据表,另一种选择就是查询最大计数,前提是您的实体配置了导航属性,以便您的客户实体可以与它的订单集合相关:

var maxOrderCount = dbContext.Customers
    .OrderByDescending(x => x.Orders.Count)
    .Select(x => x.Orders.Count)
    .First();

var customers = dbContext.Customers
    .Where(x => x.Orders.Count == maxOrderCount)
    .ToList();

如果您只需要客户 ID,请在 ToList() 之前添加 .Select(x =&gt; x.CustomerId)。它运行两个查询,但它们相当简单,只返回所需的数据,而不是可能返回所有客户 ID/数据。

【讨论】:

很棒的答案。谢谢史蒂夫。

以上是关于将“SELECT TOP (1) WITH TIES”转换为 EF Core的主要内容,如果未能解决你的问题,请参考以下文章

如何将Ios文件上传到

Javascript 将正则表达式 \\n 替换为 \n,将 \\t 替换为 \t,将 \\r 替换为 \r 等等

如何将视频文件转换格式

sh 一个将生成CA的脚本,将CA导入到钥匙串中,然后它将创建一个证书并与CA签名,然后将其导入到

python怎么将0写入文件?

如何将CMD窗口背景改成透明?