为啥 Enumerable.Range 比直接 yield 循环快?
Posted
技术标签:
【中文标题】为啥 Enumerable.Range 比直接 yield 循环快?【英文标题】:Why is Enumerable.Range faster than a direct yield loop?为什么 Enumerable.Range 比直接 yield 循环快? 【发布时间】:2010-09-29 08:05:13 【问题描述】:下面的代码是检查执行相同解决方案的三种不同方法的性能。
public static void Main(string[] args)
// for loop
Stopwatch sw = Stopwatch.StartNew();
int accumulator = 0;
for (int i = 1; i <= 100000000; ++i)
accumulator += i;
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, accumulator);
//Enumerable.Range
Stopwatch sw = Stopwatch.StartNew();
var ret = Enumerable.Range(1, 100000000).Aggregate(0, (accumulator, n) => accumulator + n);
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, ret);
//self-made IEnumerable<int>
Stopwatch sw = Stopwatch.StartNew();
var ret = GetIntRange(1, 100000000).Aggregate(0, (accumulator, n) => accumulator + n);
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, ret);
private static IEnumerable<int> GetIntRange(int start, int count)
int end = start + count;
for (int i = start; i < end; ++i)
yield return i;
结果是:
time = 306; result = 987459712
time = 1301; result = 987459712
time = 2860; result = 987459712
“for 循环”比其他两种解决方案更快并不奇怪,因为 Enumerable.Aggregate 需要更多的方法调用。然而,让我感到惊讶的是,“Enumerable.Range”比“自制的 IEnumerable”要快。我认为 Enumerable.Range 会比简单的 GetIntRange 方法有更多的开销。
这可能是什么原因?
【问题讨论】:
【参考方案1】:假设这是一个正在运行的发布版本,否则所有比较都将关闭,因为 JIT 将无法正常工作。
您可以查看带有reflector 的程序集,并查看“yield”语句正在扩展什么。编译器将创建一个类来封装迭代器。生成的代码可能比 Enumerable.Range 的实现更多,而后者可能是手动编码的
【讨论】:
【参考方案2】:为什么Enumerable.Range
比你自制的GetIntRange
慢?事实上,如果Enumerable.Range
被定义为
public static class Enumerable
public static IEnumerable<int> Range(int start, int count)
var end = start + count;
for(var current = start; current < end; ++current)
yield return current;
那么它应该和你自制的GetIntRange
一样快。这实际上是 Enumerable.Range
的参考实现,没有编译器或程序员的任何技巧。
您可能希望将您的 GetIntRange
和 System.Linq.Enumerable.Range
与以下实现进行比较(当然,正如 Rob 指出的那样,在发布模式下编译)。此实现可能会针对编译器从迭代器块生成的内容进行轻微优化。
public static class Enumerable
public static IEnumerable<int> Range(int start, int count)
return new RangeEnumerable(start, count);
private class RangeEnumerable : IEnumerable<int>
private int _Start;
private int _Count;
public RangeEnumerable(int start, int count)
_Start = start;
_Count = count;
public virtual IEnumerator<int> GetEnumerator()
return new RangeEnumerator(_Start, _Count);
IEnumerator IEnumerable.GetEnumerator()
return GetEnumerator();
private class RangeEnumerator : IEnumerator<int>
private int _Current;
private int _End;
public RangeEnumerator(int start, int count)
_Current = start - 1;
_End = start + count;
public virtual void Dispose()
_Current = _End;
public virtual void Reset()
throw new NotImplementedException();
public virtual bool MoveNext()
++_Current;
return _Current < _End;
public virtual int Current get return _Current;
object IEnumerator.Current get return Current;
【讨论】:
【参考方案3】:我的猜测是您正在调试器中运行。这是我的结果,使用“/o+ /debug-”从命令行构建
time = 142; result = 987459712
time = 1590; result = 987459712
time = 1792; result = 987459712
仍有细微差别,但并不那么明显。迭代器块的实现不如量身定制的解决方案那么高效,但它们非常好。
【讨论】:
是的,我在调试模式下进行了实验。所以,自制的方法生成调试代码。发布速度要快得多。 这里有两件事:在调试模式下构建,在调试器中运行而不是在没有附加调试器的情况下执行。后者有更大的不同。【参考方案4】:Reflector 输出略有不同(以及参数检查和额外的内部化水平在这里绝对不相关)。基本代码更像:
public static IEnumerable<int> Range(int start, int count)
for(int current = 0; current < count; ++current)
yield return start + current;
也就是说,它们不是另一个局部变量,而是为每个产量应用一个额外的加法。
我已尝试对此进行基准测试,但我无法停止足够多的外部流程来获得可理解的结果。我还尝试了每个测试两次以忽略 JIT 编译器的影响,但即使这样也有“有趣”的结果。
这是我的结果示例:
运行 0: 时间 = 4149;结果 = 405000000450000000 时间 = 25645;结果 = 405000000450000000 时间 = 39229;结果 = 405000000450000000 时间 = 29872;结果 = 405000000450000000 时间 = 4277;结果 = 405000000450000000 时间 = 26878;结果 = 405000000450000000 时间 = 26333;结果 = 405000000450000000 时间 = 26684;结果 = 405000000450000000 运行 1: 时间 = 4063;结果 = 405000000450000000 时间 = 22714;结果 = 405000000450000000 时间 = 34744;结果 = 405000000450000000 时间 = 26954;结果 = 405000000450000000 时间 = 4033;结果 = 405000000450000000 时间 = 26657;结果 = 405000000450000000 时间 = 25855;结果 = 405000000450000000 时间 = 25031;结果 = 405000000450000000 运行 2: 时间 = 4021;结果 = 405000000450000000 时间 = 21815;结果 = 405000000450000000 时间 = 34304;结果 = 405000000450000000 时间 = 32040;结果 = 405000000450000000 时间 = 3993;结果 = 405000000450000000 时间 = 24779;结果 = 405000000450000000 时间 = 29275;结果 = 405000000450000000 时间 = 32254;结果 = 405000000450000000和代码
using System;
using System.Linq;
using System.Collections.Generic;
using System.Diagnostics;
namespace RangeTests
class TestRange
public static void Main(string[] args)
for(int l = 1; l <= 2; ++l)
const int N = 900000000;
System.GC.Collect(2);
// for loop
Stopwatch sw = Stopwatch.StartNew();
long accumulator = 0;
for (int i = 1; i <= N; ++i)
accumulator += i;
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, accumulator);
System.GC.Collect(2);
//Enumerable.Range
Stopwatch sw = Stopwatch.StartNew();
var ret = Enumerable.Range(1, N).Aggregate(0, (long accumulator,int n) => accumulator + n);
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, ret);
System.GC.Collect(2);
//self-made IEnumerable<int>
Stopwatch sw = Stopwatch.StartNew();
var ret = GetIntRange(1, N).Aggregate(0, (long accumulator,int n) => accumulator + n);
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, ret);
System.GC.Collect(2);
//self-made adjusted IEnumerable<int>
Stopwatch sw = Stopwatch.StartNew();
var ret = GetRange(1, N).Aggregate(0, (long accumulator,int n) => accumulator + n);
sw.Stop();
Console.WriteLine("time = 0; result = 1", sw.ElapsedMilliseconds, ret);
System.GC.Collect(2);
Console.WriteLine();
private static IEnumerable<int> GetIntRange(int start, int count)
int end = start + count;
for (int i = start; i < end; ++i)
yield return i;
private static IEnumerable<int> GetRange(int start, int count)
for (int i = 0; i < count; ++i)
yield return start + i;
编译
csc.exe -optimize+ -debug- RangeTests.cs
【讨论】:
以上是关于为啥 Enumerable.Range 比直接 yield 循环快?的主要内容,如果未能解决你的问题,请参考以下文章
为啥重复 Enumerable 到 Observable 转换块