实体框架性能问题
Posted
技术标签:
【中文标题】实体框架性能问题【英文标题】:Entity Framework Performance Issue 【发布时间】:2011-11-16 05:14:28 【问题描述】:我遇到了 Entity Framework 的一个有趣的性能问题。我正在使用代码优先。
这是我的实体的结构:
一本书可以有很多评论。 评论与一本书相关联。 评论可以有一个或多个评论。 一条评论与一条评论相关联。
public class Book
public int BookId get; set;
// ...
public ICollection<Review> Reviews get; set;
public class Review
public int ReviewId get; set;
public int BookId get; set;
public Book Book get; set;
public ICollection<Comment> Comments get; set;
public class Comment
public int CommentId get; set;
public int ReviewId get; set;
public Review Review get; set;
我用大量数据填充了我的数据库并添加了适当的索引。我正在尝试使用以下查询检索一本包含 10,000 条评论的书:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.FirstOrDefault();
这本书有 10,000 条评论。此查询的执行时间约为 4 秒。运行完全相同的查询(通过 SQL Profiler)实际上很快就会返回。我使用相同的查询和一个 SqlDataAdapter 和自定义对象来检索数据,它在 500 毫秒内完成。
使用 ANTS Performance Profiler 看起来大部分时间都花在了做一些不同的事情上:
Equals 方法被调用了 5000 万次。
有谁知道为什么它需要调用 5000 万次以及如何提高性能?
【问题讨论】:
您是否真的查看了您的语句正在生成什么查询,或者您是否假设它是最佳查询? 问题不是我所说的查询。我采用了 EF 生成的确切查询,并使用常规 ADO.net 在 Sql 数据适配器中使用它,手动加载相同的对象。它在不到一秒的时间内运行。 IL 是什么样的? 您的导航属性应标记为virtual
。我不确定这是否相关。
@Yuck - 不,我不想延迟加载。我想急切地加载所有 10,000 条记录,以便确定是否可以在我们的应用程序中使用它。我们将遇到需要加载非常大的对象图的场景。我看不出让它延迟加载与热切加载会如何改善这一点。
【参考方案1】:
为什么 Equals 被称为 50M 次?
听起来很可疑。您有 10.000 条评论和 50.000.000 次致电 Equals
。假设这是由 EF 内部实现的身份映射引起的。身份映射确保每个具有唯一键的实体仅由上下文跟踪一次,因此如果上下文已经具有与从数据库加载的记录具有相同键的实例,它将不会实现新实例,而是使用现有实例。现在这怎么能与这些数字相吻合呢?我可怕的猜测:
=============================================
1st record read | 0 comparisons
2nd record read | 1 comparison
3rd record read | 2 comparisons
...
10.000th record read | 9.999 comparisons
这意味着将每个新记录与身份映射中的每个现有记录进行比较。通过应用数学计算所有比较的总和,我们可以使用称为“算术序列”的东西:
a(n) = a(n-1) + 1
Sum(n) = (n / 2) * (a(1) + a(n))
Sum(10.000) = 5.000 * (0 + 9.999) => 5.000 * 10.000 = 50.000.000
我希望我的假设或计算没有出错。等待!我希望我做错了,因为这看起来不太好。
尝试关闭更改跟踪 = 希望关闭身份映射检查。
这可能很棘手。开始:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.AsNoTracking()
.FirstOrDefault();
但是很有可能您的导航属性不会被填充(因为它是由更改跟踪处理的)。在这种情况下使用这种方法:
var book = db.Books.Where(b => b.BookId == id).AsNoTracking().FirstOrDefault();
book.Reviews = db.Reviews.Where(r => r.BookId == id).AsNoTracking().ToList();
你能看到传递给 Equals 的对象类型是什么吗?我认为它应该只比较主键,甚至 50M 整数比较也不应该是这样的问题。
附带说明 EF 很慢 - 这是众所周知的事实。它还在实体化实体时在内部使用反射,因此简单的 10.000 条记录可能需要“一些时间”。除非您已经这样做了,否则您还可以关闭动态代理创建 (db.Configuration.ProxyCreationEnabled
)。
【讨论】:
很棒的分析!根据我前段时间所做的测试(没有导航属性的简单实体),AsNoTracking
将实现时间减少到 50%。我可以想象,虽然为跟踪加载的实体创建快照比在身份映射中调用 Equals
更昂贵。如果您在相同的上下文中第二次调用相同的查询(都被跟踪),它会快速返回(小于第一次调用的 1/10),比不跟踪加载要快得多 - 这让我猜想Equals
检查在身份图中相对便宜。
顺便说一句:Include
也适用于AsNoTracking()
,导航集合被填充。 (或者你的意思是不会填充反向导航属性Review.Book
?)【参考方案2】:
我知道这听起来很蹩脚,但你有没有尝试过相反的方法,例如:
var reviewsAndBooks = db.Reviews.Where(r => r.Book.BookId == id)
.Include(r => r.Book);
当您以这种方式处理查询时,我注意到有时 EF 的性能会更好(但我没有时间弄清楚原因)。
【讨论】:
由于死锁问题,我个人会避免这种情况。以上是关于实体框架性能问题的主要内容,如果未能解决你的问题,请参考以下文章