在从 C++ 转换为 C# 的代码中，我应该使用啥来代替 memcpy？

Posted 2023-02-22

技术标签:

【中文标题】在从 C++ 转换为 C# 的代码中，我应该使用啥来代替 memcpy？【英文标题】：In code converted from C++ to C#, what should I use instead of memcpy?在从 C++ 转换为 C# 的代码中，我应该使用什么来代替 memcpy？ 【发布时间】：2018-08-01 01:30:10 【问题描述】：

有问题的行在这里：

memcpy(v[0], b_y1[0], 160U * sizeof(double));

其中v 和b_y1 区域双精度数组 (double[])。

这条线到底在做什么？它是通过将 MatLab 转换为 C++ 到 C# 生成的。如果需要，我可以提供下面的完整功能。

【问题讨论】：

Array.Copy(v, b_y1, 160);从 src 数组复制到 dst 数组。我认为这在 C# 中也是如此。我认为我最初标记的副本不适合您的问题，因此我撤回了该投票。我认为this duplicate 提供了您需要的答案。哦，好像我搞错了 memcpy 中的来源是什么。 memcpy function in c#的可能重复 【参考方案1】：

有很多方法可以做到这一点。如果您选择并使用memcpy，请导入 DLL。

不过你也可以使用：

Buffer.BlockCopy

从源数组中复制指定数量的字节从特定位置开始到目标数组的特定偏移量偏移量。

Array.Copy

将一个数组中的一系列元素复制到另一个数组并执行根据需要键入铸造和装箱。

按照建议手动逐项复制

甚至更快的是使用fixed和unsafe和指针

但是，如果您真的想要速度，Array.Copy 和 Buffer.BlockCopy 可能是您最快和最接近的匹配。

基准测试

只是因为我打开了基准测试器。赛马！

----------------------------------------------------------------------------
Operating System : Microsoft Windows 10 Pro
Version          : 10.0.17134
----------------------------------------------------------------------------
CPU Name         : Intel(R) Core(TM) i7-3770K CPU @ 3.50GHz
Description      : Intel64 Family 6 Model 58 Stepping 9
Cores (Threads)  : 4 (8)      : Architecture  : x64
Clock Speed      : 3901 MHz   : Bus Speed     : 100 MHz
L2Cache          : 1 MB       : L3Cache       : 8 MB
----------------------------------------------------------------------------

Total Benchmarks : Inputs (1) * Scales (7) * Benchmarks (4) * Runs (500) = 14,000

结果 1

----------------------------------------------------------------------------
Mode             : Release (64Bit)
Test Framework   : .NET Framework 4.7.1 (CLR 4.0.30319.42000)
----------------------------------------------------------------------------

Total Benchmarks : Inputs (1) * Scales (7) * Benchmarks (4) * Runs (500) = 14,000

NET 框架 4.7.1

--- Standard input --------------------------------------------------------------------
| Value           |   Average |   Fastest |    Cycles |    Garbage | Test |      Gain |
--- Scale 10 ----------------------------------------------------------- Time 0.994 ---
| ArrayCopy       |  0.005 ms |  0.004 ms |  23.016 K |   7.927 KB | N/A  |   14.98 % |
| ElemCopy        |  0.006 ms |  0.004 ms |  23.591 K |   8.000 KB | N/A  |   12.08 % |
| ElemCopy Unsafe |  0.006 ms |  0.004 ms |  26.426 K |   7.915 KB | N/A  |    0.77 % |
| BlockCopy       |  0.006 ms |  0.004 ms |  26.295 K |   7.836 KB | Base |    0.00 % |
--- Scale 100 ---------------------------------------------------------- Time 1.124 ---
| ArrayCopy       |  0.005 ms |  0.004 ms |  20.581 K |   7.937 KB | N/A  |    1.60 % |
| BlockCopy       |  0.005 ms |  0.004 ms |  20.915 K |   8.000 KB | Base |    0.00 % |
| ElemCopy        |  0.005 ms |  0.004 ms |  21.836 K |   8.000 KB | N/A  |   -4.15 % |
| ElemCopy Unsafe |  0.005 ms |  0.004 ms |  22.357 K |   7.970 KB | N/A  |  -10.85 % |
--- Scale 1,000 -------------------------------------------------------- Time 1.322 ---
| ArrayCopy       |  0.005 ms |  0.005 ms |  23.106 K |   8.000 KB | N/A  |    6.31 % |
| ElemCopy Unsafe |  0.006 ms |  0.005 ms |  24.075 K |   8.000 KB | N/A  |    1.41 % |
| ElemCopy        |  0.006 ms |  0.005 ms |  24.392 K |   8.000 KB | N/A  |    0.46 % |
| BlockCopy       |  0.006 ms |  0.004 ms |  24.766 K |   8.015 KB | Base |    0.00 % |
--- Scale 10,000 ------------------------------------------------------- Time 1.727 ---
| BlockCopy       |  0.013 ms |  0.009 ms |  51.749 K |  86.172 KB | Base |    0.00 % |
| ArrayCopy       |  0.016 ms |  0.014 ms |  61.467 K |  86.172 KB | N/A  |  -23.61 % |
| ElemCopy Unsafe |  0.017 ms |  0.015 ms |  63.659 K |  86.172 KB | N/A  |  -28.22 % |
| ElemCopy        |  0.019 ms |  0.016 ms |  70.479 K |  86.172 KB | N/A  |  -41.93 % |
--- Scale 100,000 ------------------------------------------------------ Time 1.825 ---
| BlockCopy       |  0.050 ms |  0.045 ms | 178.829 K | 789.273 KB | Base |    0.00 % |
| ArrayCopy       |  0.101 ms |  0.089 ms | 357.518 K | 789.273 KB | N/A  | -102.24 % |
| ElemCopy Unsafe |  0.121 ms |  0.108 ms | 428.179 K | 789.273 KB | N/A  | -143.35 % |
| ElemCopy        |  0.133 ms |  0.118 ms | 469.168 K | 789.273 KB | N/A  | -166.41 % |
--- Scale 1,000,000 ---------------------------------------------------- Time 4.946 ---
| BlockCopy       |  0.494 ms |  0.409 ms |   1.730 M |   7.637 MB | Base |    0.00 % |
| ElemCopy Unsafe |  1.336 ms |  1.164 ms |   4.674 M |   7.637 MB | N/A  | -170.59 % |
| ArrayCopy       |  1.478 ms |  1.298 ms |   5.169 M |   7.637 MB | N/A  | -199.40 % |
| ElemCopy        |  1.910 ms |  1.607 ms |   6.675 M |   7.637 MB | N/A  | -286.95 % |
--- Scale 10,000,000 -------------------------------------------------- Time 31.376 ---
| BlockCopy       |  5.408 ms |  4.589 ms |  18.896 M |  76.302 MB | Base |    0.00 % |
| ElemCopy Unsafe | 43.981 ms | 35.344 ms | 153.137 M |  76.302 MB | N/A  | -713.21 % |
| ElemCopy        | 46.318 ms | 37.623 ms | 161.225 M |  76.302 MB | N/A  | -756.43 % |
| ArrayCopy       | 48.171 ms | 38.471 ms | 167.548 M |  76.302 MB | N/A  | -790.69 % |
---------------------------------------------------------------------------------------

结果 2

----------------------------------------------------------------------------
Mode             : Release (64Bit)
Test Framework   : .Net Core 2.0 (CLR 4.0.30319.42000)
----------------------------------------------------------------------------

Total Benchmarks : Inputs (1) * Scales (7) * Benchmarks (4) * Runs (500) = 14,000

.Net Core 2.0

测试 1

--- Standard input ----------------------------------------------------------------------
| Value           |   Average |   Fastest |    Cycles |    Garbage | Test |        Gain |
--- Scale 10 ------------------------------------------------------------- Time 1.221 ---
| ElemCopy Unsafe |  0.006 ms |  0.003 ms |  23.940 K |   8.000 KB | N/A  |     13.53 % |
| BlockCopy       |  0.007 ms |  0.004 ms |  27.573 K |   7.923 KB | Base |      0.00 % |
| ArrayCopy       |  0.007 ms |  0.004 ms |  28.341 K |   7.914 KB | N/A  |     -5.98 % |
| ElemCopy        |  0.007 ms |  0.003 ms |  28.939 K |   7.914 KB | N/A  |     -6.12 % |
--- Scale 100 ------------------------------------------------------------ Time 1.333 ---
| BlockCopy       |  0.005 ms |  0.004 ms |  19.855 K |   7.970 KB | Base |      0.00 % |
| ElemCopy        |  0.005 ms |  0.004 ms |  22.061 K |   7.950 KB | N/A  |    -11.44 % |
| ArrayCopy       |  0.005 ms |  0.004 ms |  22.793 K |   8.000 KB | N/A  |    -15.94 % |
| ElemCopy Unsafe |  0.006 ms |  0.004 ms |  23.715 K |   7.999 KB | N/A  |    -21.65 % |
--- Scale 1,000 ---------------------------------------------------------- Time 1.464 ---
| BlockCopy       |  0.005 ms |  0.004 ms |  21.045 K |   8.001 KB | Base |      0.00 % |
| ElemCopy Unsafe |  0.005 ms |  0.004 ms |  21.731 K |   8.016 KB | N/A  |     -5.53 % |
| ElemCopy        |  0.006 ms |  0.004 ms |  24.120 K |   8.000 KB | N/A  |    -17.49 % |
| ArrayCopy       |  0.006 ms |  0.004 ms |  27.113 K |   8.013 KB | N/A  |    -31.62 % |
--- Scale 10,000 --------------------------------------------------------- Time 1.846 ---
| BlockCopy       |  0.010 ms |  0.008 ms |  37.962 K |  86.172 KB | Base |      0.00 % |
| ArrayCopy       |  0.018 ms |  0.014 ms |  67.134 K |  86.172 KB | N/A  |    -83.72 % |
| ElemCopy Unsafe |  0.019 ms |  0.014 ms |  72.097 K |  86.172 KB | N/A  |    -99.35 % |
| ElemCopy        |  0.021 ms |  0.016 ms |  77.657 K |  86.172 KB | N/A  |   -113.22 % |
--- Scale 100,000 -------------------------------------------------------- Time 2.880 ---
| BlockCopy       |  0.027 ms |  0.020 ms | 100.355 K | 789.305 KB | Base |      0.00 % |
| ArrayCopy       |  0.385 ms |  0.289 ms |   1.346 M | 789.305 KB | N/A  | -1,305.09 % |
| ElemCopy Unsafe |  0.404 ms |  0.280 ms |   1.414 M | 789.305 KB | N/A  | -1,374.97 % |
| ElemCopy        |  0.408 ms |  0.322 ms |   1.424 M | 789.305 KB | N/A  | -1,389.61 % |
--- Scale 1,000,000 ----------------------------------------------------- Time 11.892 ---
| BlockCopy       |  0.632 ms |  0.415 ms |   2.198 M |   7.637 MB | Base |      0.00 % |
| ElemCopy        |  4.645 ms |  3.347 ms |  16.159 M |   7.637 MB | N/A  |   -635.36 % |
| ArrayCopy       |  4.706 ms |  3.684 ms |  16.376 M |   7.637 MB | N/A  |   -645.01 % |
| ElemCopy Unsafe |  4.774 ms |  3.467 ms |  16.568 M |   7.637 MB | N/A  |   -655.66 % |
--- Scale 10,000,000 ---------------------------------------------------- Time 35.806 ---
| BlockCopy       |  6.116 ms |  4.635 ms |  21.294 M |  76.302 MB | Base |      0.00 % |
| ElemCopy Unsafe | 44.132 ms | 35.039 ms | 153.807 M |  76.302 MB | N/A  |   -621.63 % |
| ArrayCopy       | 49.990 ms | 40.360 ms | 173.860 M |  76.302 MB | N/A  |   -717.41 % |
| ElemCopy        | 50.552 ms | 38.044 ms | 175.432 M |  76.302 MB | N/A  |   -726.60 % |
-----------------------------------------------------------------------------------------

输入

public static double[] ArrayOfDouble(int scale)

   return Enumerable.Range(1, scale)
                    .Select(x =>_rand.NextDouble())
                    .ToArray();

代码

[Test("BlockCopy", "", true)]
public double[] Test1(double[] input, int scale)

   var result = new double[scale];
   Buffer.BlockCopy(input, 0, result, 0, input.Length);
   return result;


[Test("ArrayCopy", "", false)]
public  double[] Test2(double[] input, int scale)

   var result = new double[scale];
   Array.Copy(input, 0, result, 0, input.Length);
   return result;


[Test("ElemCopy", "", false)]
public  double[] Test3(double[] input, int scale)

   var result = new double[scale];
   for (var i=0; i <input.Length; i++)
      result[i] = input[i];
   return result;


[Test("ElemCopy Unsafe", "", false)]
unsafe public  double[] Test4(double[] input, int scale)

   var result = new double[scale];
   fixed(double* pInput = input, pResult = result)
   for (var i=0; i <input.Length; i++)
      *(pResult+i) = *(pResult+i);
   return result;

总结

对此应持保留态度，任何实际测试都应在您自己的系统上完成。然而，这是对我在缩放时得到的结果的一个很好的估计。

在这种情况下，双打 BlockCopy 表现得非常好，ArrayCopy 在高比例下下降，我不知道为什么，Unsafe 在这类事情上总是有性能优势，但无法与专用 BCL 相提并论方法。

【讨论】：

我怀疑 Knuth 会对那些显然没有听说过“过早优化是万恶之源”的人数感到相当失望。 @JerryCoffin Donald Knuth 确实有道理，但是他的引述发表在 40 多年前的一本书中，当时开发是一个更加费力的过程，但说实话，我认为这一点仍然有效它现在比当时更更有效。 CPU 足够快，更少的程序受计算限制，用户界面占用的代码比例要大得多，因此即使程序受计算限制，造成瓶颈的代码百分比也比以往任何时候都小（并且几乎一直在缩小） )。 @JerryCoffin 这一切都非常有效，但是如果您可以获得一个可扩展的解决方案并且您理解它们以及相同数量的代码并且同样简单，为什么不呢？我认为带来的是完整的循环，BlockCopy，如果被理解，是没有额外的努力，它不是一个微优化，它实际上是关于相同的可打印字符，我们理解它的作用，我们理解我们在做什么，是的，拍摄以后先问问题。但我仍然理解他的语言，我理解你为什么写评论.. 真的很好【参考方案2】：

它只是将数据从b_y1 复制到v（160 双）。

最明显的替代品是这样的：

for (int i=0; i<160; i++)
    v[i] = b_y1[i];

【讨论】：

以上是关于在从 C++ 转换为 C# 的代码中，我应该使用啥来代替 memcpy？的主要内容，如果未能解决你的问题，请参考以下文章