聊聊 C# 和 C++ 中的 泛型模板 底层玩法

Posted dotNET跨平台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聊聊 C# 和 C++ 中的 泛型模板 底层玩法相关的知识,希望对你有一定的参考价值。

最近在看 C++ 的方法和类模板,我就在想 C# 中也是有这个概念的,不过叫法不一样,人家叫模板,我们叫泛型,哈哈,有点意思,这一篇我们来聊聊它们底层是怎么玩的?

一:C++ 中的模板玩法

毕竟 C++ 是兼容 C 语言,而 C 是过程式的玩法,所以 C++ 就出现了两种模板类型,分别为:函数模板类模板,下面简单分析一下。

1. 函数模板的玩法

玩之前先看看格式:template <typename T> rettype funcname (parameter list)

说实话,我感觉 C++ 这一点就做的非常好,人家在开头就特别强调了,这是一个 template,大家不要搞错了,按照这个格式,我们来一个简单的 Sum 操作,参考代码如下:

#include <iostream>

//求和函数
template <typename T> T getsum(T  t1, T  t2) 
 return t1 + t2;


int main() 

 int sum1 = getsum<int>(10, 10);

 long sum2 = getsum<long>(20, 20);

 printf("output: int:sum=%d, long: sum=%ld", sum1, sum2);

接下来我就很好奇,这种玩法和 普通方法 调用有什么不同,要想找到答案,可以用 IDA 去看它的静态汇编代码。

从静态反汇编代码看,当前生成了两个函数符号分别为:j_??$getsum@H@@YAHHH@Zj_??$getsum@J@@YAJJJ@Z,现在我们就搞清楚了,原来一旦给 模板 指定了具体类型,它就生成了一个新的函数符号。

乍一看这句话好像没什么问题,但如果你心比较细的话,会发现一个问题,如果我调用两次 getsum<int> 方法,那会生成两个具体函数吗?为了寻找答案,我们修改下代码:

int main() 

 int sum1 = getsum<int>(10, 10);

 int sum2 = getsum<int>(15, 15);

然后再用 IDA 查看一下。

哈哈,可以发现这时候并没有生成一个新的函数符号,其实往细处说:j_??$getsum@H@@YAHHH@Z  是函数签名组合出来的名字,因为它们签名一致,所以在编译阶段必然就一个了。

2. 类模板的玩法

首先看下类模板的格式:template <typename T1, typename T2, …> class className ;

还是那句话,开头一个 template 暴击,告诉你这是一个模板 😄😄😄, 接下来上一段代码:

#include <iostream>

template <typename T> class Calculator

public:
 T getsum(T a1, T b1) 
  return a1 + b1;
 
;

int main() 

 Calculator<int> cal1;
 int sum1 = cal1.getsum(10, 10);

 Calculator<long> cal2;
 int sum2 = cal2.getsum(15, 15);

 printf("output: sum1=%d, sum2=%ld", sum1,sum2);

接下来直接看 IDA 生成的汇编代码。

从上面的方法签名组织上看,有点意思,类名+方法名 柔和到一个函数符号上去了,可以看到符号不一样,说明也是根据模板实例化出的两个方法。

二:C# 中的模板玩法

接下来我们看下 C# 中如何实现 getsum 方法,当我把代码 copy 到 C# 中,我发现不能实现简单的 泛型参数 加减乘除操作,这就太搞了,网上找了下实现方式,当然也可以让 T 约束于 unmanaged,那就变成指针玩法了。

namespace ConsoleApp1

    internal class Program
    
        static void Main(string[] args)
        
            Calculator<int> calculator1 = new Calculator<int>();
            Calculator<long> calculator2 = new Calculator<long>();

            int sum1 = calculator1.getsum(10, 10);

            long sum2 = calculator2.getsum(15, 15);

            Console.WriteLine($"sum=sum1, sum2=sum2");
            Console.ReadLine();
        
    

    public class Calculator<T> where T : struct, IComparable
    
        public T getsum(T a1, T b1)
        
            if (typeof(T) == typeof(int))
            
                int a = (int)Convert.ChangeType(a1, typeof(int));
                int b = (int)Convert.ChangeType(b1, typeof(int));

                int c = a + b;
                return (T)Convert.ChangeType(c, typeof(T));
            
            else if (typeof(T) == typeof(float))
            
                float a = (float)Convert.ChangeType(a1, typeof(float));
                float b = (float)Convert.ChangeType(b1, typeof(float));

                float c = a + b;
                return (T)Convert.ChangeType(c, typeof(T));
            
            else if (typeof(T) == typeof(double))
            
                double a = (double)Convert.ChangeType(a1, typeof(double));
                double b = (double)Convert.ChangeType(b1, typeof(double));

                double c = a + b;
                return (T)Convert.ChangeType(c, typeof(T));
            
            else if (typeof(T) == typeof(decimal))
            
                decimal a = (decimal)Convert.ChangeType(a1, typeof(decimal));
                decimal b = (decimal)Convert.ChangeType(b1, typeof(decimal));

                decimal c = a + b;
                return (T)Convert.ChangeType(c, typeof(T));
            

            return default(T);
        
    

那怎么去看 Calculator<int>Calculator<long> 到底变成啥了呢?大家应该知道,C# 和 操作系统 隔了一层 C++,所以研究这种远离操作系统的语言还是有一点难度的,不过既然隔了一层 C++ ,那在 C++ 层面上必然会有所反应。

如果你熟悉 CLR 的类型系统,应该知道 C# 所有的 类 在其上都有一个 MethodTable 类来承载,所以它就是鉴别我们是否生成多个个体的依据,接下来我们用 WinDbg 查看托管堆,看看在其上是如何呈现的。

0:008> !dumpheap -stat
Statistics:
              MT    Count    TotalSize Class Name
00007ff9d37638e0        1           24 ConsoleApp1.Calculator`1[[System.Int64, System.Private.CoreLib]]
00007ff9d3763800        1           24 ConsoleApp1.Calculator`1[[System.Int32, System.Private.CoreLib]]

从输出信息看,C++ 层面变成了两个 methodtable 类,如果不信的化,还可以分别查看 mt 下的所有方法。

0:008> !dumpmt -md 00007ff9d37638e0
MethodDesc Table
           Entry       MethodDesc    JIT Name
...
00007FF9D36924E8 00007ff9d37638d0    JIT ConsoleApp1.Calculator`1[[System.Int64, System.Private.CoreLib]]..ctor()
00007FF9D36924E0 00007ff9d37638c0    JIT ConsoleApp1.Calculator`1[[System.Int64, System.Private.CoreLib]].getsum(Int64, Int64)

0:008> !dumpmt -md 00007ff9d3763800
--------------------------------------
MethodDesc Table
           Entry       MethodDesc    JIT Name
00007FF9D36924D0 00007ff9d37637f0    JIT ConsoleApp1.Calculator`1[[System.Int32, System.Private.CoreLib]]..ctor()
00007FF9D36924C8 00007ff9d37637e0    JIT ConsoleApp1.Calculator`1[[System.Int32, System.Private.CoreLib]].getsum(Int32, Int32)

从输出信息看,getsum(Int64, Int64)getsum(Int32, Int32) 方法的入口地址 Entry 是完全不一样的,所以它们是完全独立的个体。

三:总结

当看到 模板泛型 两个词,我感觉前者更 通俗易懂 一些,当给模板赋予不同类型时将会生成新的实例,在  C/C++ 中直接化为不同的函数符号,在 C# 中会生成不同的 MethodTable,由于 C# 远离机器, 所以尽量谈到 C++ 层面即可 🤣🤣🤣

以上是关于聊聊 C# 和 C++ 中的 泛型模板 底层玩法的主要内容,如果未能解决你的问题,请参考以下文章

聊聊 C# 方法重载的底层玩法

C#语法糖系列 —— 第四篇:聊聊 Span 的底层玩法

聊聊 C++ 和 C# 中的 lambda 玩法

聊聊 C# 方法重载的底层玩法

C#语法糖系列 —— 第三篇:聊聊闭包的底层玩法

聊聊 C# 中的多态底层 (虚方法调用) 是怎么玩的