为啥发布和调试模式下的代码行为不同？

Posted 2023-03-30

技术标签:

【中文标题】为啥发布和调试模式下的代码行为不同？【英文标题】：Why is code behavior different in release & debug mode?为什么发布和调试模式下的代码行为不同？ 【发布时间】：2017-12-01 10:57:34 【问题描述】：

考虑以下代码：

private static void Main(string[] args)

    var ar = new double[]
    
        100
    ;

    FillTo(ref ar, 5);
    Console.WriteLine(string.Join(",", ar.Select(a => a.ToString()).ToArray()));


public static void FillTo(ref double[] dd, int N)

    if (dd.Length >= N)
        return;

    double[] Old = dd;
    double d = double.NaN;
    if (Old.Length > 0)
        d = Old[0];

    dd = new double[N];

    for (int i = 0; i < Old.Length; i++)
    
        dd[N - Old.Length + i] = Old[i];
    
    for (int i = 0; i < N - Old.Length; i++)
        dd[i] = d;

Debug 模式下的结果是：100,100,100,100,100。但在发布模式下是：100,100,100,100,0。

发生了什么？

已使用 .NET Framework 4.7.1 和 .NET Core 2.0.0 进行了测试。

【问题讨论】：

您使用哪个版本的 Visual Studio（或编译器）？复制；将Console.WriteLine(i); 添加到最终循环 (dd[i] = d;) 中“修复”它，这表明存在编译器错误或 JIT 错误；调查 IL... @Styxxy，在 vs2015、2017 上测试并针对每个 .net 框架 >= 4.5 绝对是一个错误。如果您删除 if (dd.Length >= N) return;，它也会消失，这可能是一个更简单的复制。毫不奇怪，一旦比较是苹果对苹果，.Net Framework 和 .Net Core 的 x64 代码生成具有相似的性能，因为（默认情况下）它本质上是相同的 jit 生成代码。将 .Net Framework x86 codegen 的性能与 .Net Core 的 x86 codegen（自 2.0 开始使用 RyuJit）进行比较会很有趣。在某些情况下，旧的 jit（又名 Jit32）知道 RyuJit 不知道的一些技巧。如果您发现任何此类情况，请确保在 CoreCLR 存储库上为他们打开问题。 【参考方案1】：

这似乎是一个 JIT 错误；我已经测试过：

// ... existing code unchanged
for (int i = 0; i < N - Old.Length; i++)

    // Console.WriteLine(i); // <== comment/uncomment this line
    dd[i] = d;

并添加 Console.WriteLine(i) 修复它。唯一的 IL 变化是：

// ...
L_0040: ldc.i4.0 
L_0041: stloc.3 
L_0042: br.s L_004d
L_0044: ldarg.0 
L_0045: ldind.ref 
L_0046: ldloc.3 
L_0047: ldloc.1 
L_0048: stelem.r8 
L_0049: ldloc.3 
L_004a: ldc.i4.1 
L_004b: add 
L_004c: stloc.3 
L_004d: ldloc.3 
L_004e: ldarg.1 
L_004f: ldloc.0 
L_0050: ldlen 
L_0051: conv.i4 
L_0052: sub 
L_0053: blt.s L_0044
L_0055: ret

对

// ...
L_0040: ldc.i4.0 
L_0041: stloc.3 
L_0042: br.s L_0053
L_0044: ldloc.3 
L_0045: call void [System.Console]System.Console::WriteLine(int32)
L_004a: ldarg.0 
L_004b: ldind.ref 
L_004c: ldloc.3 
L_004d: ldloc.1 
L_004e: stelem.r8 
L_004f: ldloc.3 
L_0050: ldc.i4.1 
L_0051: add 
L_0052: stloc.3 
L_0053: ldloc.3 
L_0054: ldarg.1 
L_0055: ldloc.0 
L_0056: ldlen 
L_0057: conv.i4 
L_0058: sub 
L_0059: blt.s L_0044
L_005b: ret

看起来完全正确（唯一的区别是额外的ldloc.3 和call void [System.Console]System.Console::WriteLine(int32)，以及br.s 的不同但等效的目标）。

我怀疑它需要 JIT 修复。

环境：

Environment.Version: 4.0.30319.42000 <TargetFramework>netcoreapp2.0</TargetFramework> VS：15.5.0 预览版 5.0 dotnet --version：2.1.1

【讨论】：

那么到哪里报告bug呢？我也在 .NET full 4.7.1 上看到它，所以如果这不是 RyuJIT 错误，我会吃掉我的帽子。我无法重现，安装了 .NET 4.7.1，现在可以重现。 @MarcGravell .Net 框架 4.7.1 和 .net Core 2.0.0 @AshkanNourzadeh 老实说，我可能会记录它here，强调人们认为这是一个 RyuJIT 错误【参考方案2】：

确实是组装错误。 x64，.net 4.7.1，发布版本。

反汇编：

            for(int i = 0; i < N - Old.Length; i++)
00007FF942690ADD  xor         eax,eax  
            for(int i = 0; i < N - Old.Length; i++)
00007FF942690ADF  mov         ebx,esi  
00007FF942690AE1  sub         ebx,ebp  
00007FF942690AE3  test        ebx,ebx  
00007FF942690AE5  jle         00007FF942690AFF  
                dd[i] = d;
00007FF942690AE7  mov         rdx,qword ptr [rdi]  
00007FF942690AEA  cmp         eax,dword ptr [rdx+8]  
00007FF942690AED  jae         00007FF942690B11  
00007FF942690AEF  movsxd      rcx,eax  
00007FF942690AF2  vmovsd      qword ptr [rdx+rcx*8+10h],xmm6  
            for(int i = 0; i < N - Old.Length; i++)
00007FF942690AF9  inc         eax  
00007FF942690AFB  cmp         ebx,eax  
00007FF942690AFD  jg          00007FF942690AE7  
00007FF942690AFF  vmovaps     xmm6,xmmword ptr [rsp+20h]  
00007FF942690B06  add         rsp,30h  
00007FF942690B0A  pop         rbx  
00007FF942690B0B  pop         rbp  
00007FF942690B0C  pop         rsi  
00007FF942690B0D  pop         rdi  
00007FF942690B0E  pop         r14  
00007FF942690B10  ret

问题出在地址 00007FF942690AFD，jg 00007FF942690AE7。如果 ebx（其中包含 4，循环结束值）大于 (jg)，则它会跳回 eax，即值 i。当然，当它是 4 时它会失败，因此它不会写入数组中的最后一个元素。

它失败了，因为它是 i 的寄存器值（eax，在 0x00007FF942690AF9），然后用 4 检查它，但它仍然必须写入该值。很难确定问题的确切位置，因为它看起来可能是 (N-Old.Length) 优化的结果，因为调试版本包含该代码，但发布版本预先计算了这一点。所以这是由 jit 人来解决的 ;)

【讨论】：

这些天我需要抽出一些时间来学习汇编/CPU操作码。也许我天真地一直在想“嗯，我可以读写 IL - 我应该能够理解它” - 但我从来没有解决它:) x64/x86 并不是最棒的汇编语言；) 它有这么多的操作码，我曾经读过没有人知道所有的操作码。不确定这是不是真的，但一开始读起来并不容易。尽管它确实使用了一些简单的约定，例如 []、源部分之前的目标以及这些寄存器的全部含义（al 是 rax 的 8 位部分，eax 是 rax 的 32 位部分等）。您可以在 vs tho 中逐步完成它，这应该会教您一些要点。我相信你会很快学会，因为你已经知道 IL 操作码 ;)

以上是关于为啥发布和调试模式下的代码行为不同？的主要内容，如果未能解决你的问题，请参考以下文章