C++ | 探究函数重载的原理:函数名修饰基于Windows + Linux双系统

Posted 烽起黎明

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++ | 探究函数重载的原理:函数名修饰基于Windows + Linux双系统相关的知识,希望对你有一定的参考价值。

文章目录

一、前言

【中国乒乓和中国男足】

网上呢一直流传着这么两个说法,我国有两个体育项目大家根本不用看,也不用担心。一个是乒乓球,一个是男足。前者是“谁也赢不了!”,后者是“谁也赢不了!

  • 相信了解的读者就可以看出来这两句话的不同含义了,虽然都叫做【谁也赢不了】,但是呢因为这个所指代的对象不一样也就造成了这两句话的意思不同
  • 其实对于函数重载来说也具有相同的意味,虽然看上去一样,但因为某些内容不一样便造成了函数重载

【文言文一词多义】

自然语言中,一个词可以有多重含义,人们可以通过上下文来判断该词真实的含义,即该词被重载了

  • 相信你在上初高中的时候一定学习过文言文,里面有一种东西叫做 —— 一词多义,也就是对于一个词来说可以存在不同的含义,它所存在的语境不同就会导致它的意思有所不同
  • 从编程语言的角度来说就可以说这个词被重载了,虽然都是一个词,但却具有不同的含义


通过上述两个生活小案例,相信你对函数重载一定有了一个基本的概念,接下去让我们正式来学习一下函数重载💻

二、函数重载概念引入

【函数重载】:是函数的一种特殊情况,C++允许在同一作用域中声明几个功能类似的同名函数,这些同名函数的形参列表(参数个数 或 类型 或 类型顺序)不同,常用来处理实现功能类似数据类型不同的问题

  • 对于函数重载这个概念,我们在学习C语言的时候是没有听过的,因为在C语言中是不存在函数重载概念的。只有在.cpp的文件中,我们才可以进行函数重载



对于C++中的函数重载来说,随着不同类型或者个数的实参传入,编译器会自动识别向对应的函数去进行一个调用

1、参数【类型】不同构成重载

  • 首先第一种就是【类型】不同可以构成函数重载,这个类型值得不仅仅是返回值类型,更重要的是对于形参的类型
  • 可以看到,下面的两个函数虽然函数名相同,但是因为形参的类型不同,所以可以处理的数据种类就不一样
int Add(int x, int y)

	return x + y;


double Add(double x, double y)

	return x + y;

int ret1 = Add(1, 2);
double ret2 = Add(1.1, 2.2);
  • 运行结果就不展示了,我们可以通过调试去观察一下编译器是对于重载的函数是否真的可以做到一个自动识别

2、参数【个数】不同构成重载

  • 第二种的话就是传入实参的个数不同也会可以构成重载。可以看到我写了一个三参的Add函数
int Add(int x, int y)

	return x + y;


int Add(int x, int y, int z)

	return x + y + z;

int ret1 = Add(1, 2);
int ret2 = Add(1, 2, 3);
  • 同样,我们通过调试来观察程序的思维

3、参数【类型顺序】不同构成重载

  • 最后一种的话可能你没有听说过,若是形参的两个类型顺序发生了改变,那也可以算是函数重载
void Print(int x, char c)

	cout << x << " ";
	cout << c << " ";
	cout << endl;


void Print(char c, int x)

	cout << c << " ";
	cout << x << " ";
	cout << endl;

Print(1, 'x');
Print('y', 2);
  • 可以看出,编译器依旧会进行一个自动识别

三、函数重载的原理

  • 对于函数重载的原理就是 —— 采用了函数名修饰,所以编译器可以通过修饰后的不同的函数去找到对应的函数

1、回顾程序编译 + 链接的过程

在观察函数重载的原理之前,我们来浅浅回顾一下C语言中所介绍的程序编译+链接全过程

  • 我们知道,要诞生一个可执行程序,就需要经过【翻译环境】和【运行环境】,我们主要讨论的是前者。而对于前者,又可以细分为【编译】+ 【链接】这两个过程,在经过编译器进行预编译、编译、汇编之后,之前的源文件test.c就会形成一个目标文件test.o
  • 但是在一个目录下,可能存在多个源文件,一个文件又可能调用了另一个文件,那此时它们就都需要进行编译产生.o的目标文件

  • 但是对于目标文件来说是不可以直接被执行的,因此需要将当前目录下生成的多个目标文件经过链接器进行链接,若是在目标文件中还使用到了库中的函数,那么链接器就会到库中去寻找对应的库函数,一起进行链接
  • 最终形成的才是一个可执行文件.exe,在Linux下是a.out


现在我们要去思考的一个点是,假如test.cpp中使用到了add.c中的函数Add,而且恰好这个函数还进行了函数重载,那编译器是怎么知道要去add.c中寻找这个重载函数的呢❓

首先你要清楚在编译阶段后的【链接】阶段,它的功能是什么

  1. 合并段表
  2. 符号表的合并和符号表的重定位
  • 当链接器进行链接的时候,它看到test.o中调用到了Add函数,此时它就会去其他目标文件中通过一定的方式识别找到它所匹配调用的这个重载函数,然后通过将两个目标文件的符号表进行合并也就形成了最后的可执行文件


但是还有一点很困惑的是,编译器是怎样的方式去识别的呢?我们可以通过查看【反汇编】代码来观察一下

2、Linux下【objdump】查看反汇编

首先我们来看下Linux平台下对于重载函数的反汇编指令是怎样的

  • 首先生成一下这个可执行文件。然后我使用到的一个是查看目标文件或者可执行的目标文件的构成的gcc工具 —— objdump。这个也是Linux下的一个指令,感兴趣的可以去了解一下 链接

  • 此时我们就可以来看一下生成的反汇编指令是怎样的,直接拉到重载的两个Add函数这里
  • 可以看到,原本的第一个函数定义变成了<_Z3Addii>,第二个函数则变成了<_Z3Adddd>这是为什么呢?

  • 为了进行对于,我在也写了一份C语言的代码,并且使用gcc去进行了一个编译。同样我们也可以去查看它的反汇编指令
  • 此时便观察到C语言对于函数名在编译 + 链接之后并没有做什么过多的修改,而是直接使用的原来的函数名【这里只有一个函数的原因是C不支持函数重载】


所以我们可以得出结论:对于C语言来说是不存在函数名修饰的,只有C++支持,会将函数参数类型信息添加到修改后的名字中

3、Windows下反汇编查看

Linux中查看完之后我们再来Windows中来看看,为什么要先看Linux呢?看下去你就知道了

  • 在VS2019中因为屏蔽了过多细节,所以我使用VC6.0进行一个演示【此时你就就可以看出在Windows下的函数名修饰是相当得复杂】

  • 一样,通过C和C++两个源程序进行运行,因为我处在VS这个集成开发环境中,所以不需要对源文件进行编译 + 链接,只需点击运行即可
  • 可以看到,对于.cpp的文件来说,函数名在修饰之后变得是异常复杂。可是对于.c的文件来说,使用的还是原先的Add函数名,没有发生变化

  • 本来想观察一下Windows环境下的函数名修饰,但是如此复杂度的规则这可如何是好呢?那我们就稍微地来聊一聊有关Windows下的【函数名修饰规则】


看了上面这些我想应该也够了,如果你还想要再深度地进行了解的话可以看看这篇文章 —— 链接

4、函数名修饰规则总结

通过上面的观察我们就可以来总结一下有关函数名的修饰规则

  • 在Linux环境下,C++的函数名修饰规则为【_Z + 函数长度 + 函数名 + 类型首字母】
    • Linux下的编译器为gcc/g++,一个开源组织搞的项目
  • 在Windows环境下,C++的函数名修饰规则为 【? + 函数名 + @@YA + 返回值 + 参数1 + 参数2 + @Z】,int类型对应的是字母H,void类型对应的是字母X,double类型对应的是字母N。扩展:float类型对应的是字母M(可以当做了解一下
    • Windows下的编译器是cl.exe,集成在VS中,是由微软公司发布的

解答:为何而C语言不支持函数重载❓

在看了上面有关C++函数重载的原理之后,就可以回答为何C语言不支持函数重载

  • 因为对于C语言来说,在经过编译后函数名修饰不会发生任何的改变,还是采用原先的函数名,若是想C++那样写重载函数的话就会别编译器认为是语法错误。因为编译器无法通过不同的函数名修饰去找到对应所调用的函数
  • 所以就可以看出对于C++的函数重载而言是通过修饰后的函数名去进行比对的,无论是Windows还是会Linux都是一样,只是不同的平台拥有各自的编译器,每个编译器所规定的语法是不同的

错误案例分析🔍

通过研究了函数重载的原理之后,最后再来说说比较容易误解的写法,你认为下面的两个函数构成函数重载吗?

int Add(int x, int y)

	return x + y;


double Add(int x, int y)

	return x + y;

  • 【答案揭晓】:No,这样不可以构成函数重载,仅仅是返回值的不同无法编译器认定为是函数重载,因为对于函数名和形参类型完完全全相同的两个函数在进行函数名修饰之后也是一样的


  • 可以看到,无论是对于Windows还是Linux下,连编译都是通不过的,所以函数重载只有三种形式,不要搞混淆了

四、总结与提炼

最后我们来总结一下本文所学习的的内容📖

  • 首先在文章的开始,我通过两个生活中的小案例先带读者了解了什么是函数重载的概念。然后讲述了有关函数重载的三种形式,分别是:【类型】不同、【个数】不同和【类型顺序】不同三种。对函数重载有了一个基本的认识
  • 然后我们便通过双系统深入探究了对于C++而言对函数在编译之后会进行一个函数名修饰,Linux环境下易理解一些,Windows环境下的解析过于复杂,若是有兴趣的读者可以继续深入

以上就是本文要介绍的所有内容,感谢您的阅读🌹

C++编译器的函数名修饰规则

     我们知道在C++中有函数重载这样一个东西,当我们定义了几个功能类似且函数名是一样的函数的时候,只要它的参数列表不同,编译是可以通过的,但是在C中是不可以的。

 

double add(double a, double b)
{
    return a + b;
}

int add(int a, char b)
{
    return a + b;
}
char add(char a, char b)
{
    return a + b;
}

 

如果这样写的代码,在C中会报出errorC2371,说是add函数重定义。但是如果在C++环境下这样是允许的,叫做函数的重载,只要你的几个函数符合函数重载的要求,是完全没有问题的。这就引出了在C和C++中函数名的修饰规则,为什么在C 中就是不行的?

 

       

double add(double a, double b);
//{
// return a + b;
//}

 

我把这个函数的定义改为声明,然后在main函数中调用,就可以看到提示中的

 

1. C编译器的函数名修饰规则 

编译器给我们报出了一个链接错误,可以看到_add这样的函数,这就是在C环境下编译器对我们函数名的修饰,可以看到是在函数的前面加上下划线,当然这种修改实在默认调用约定__cdecl的情况下,如果在__stdcall调用约定,编译器和链接器会在输出函数名前加上一个下划线前缀,函数名后面加上一个“@”符号和其参数的字节数,__fastcall调用约定在输出函数名前加上一个“@”符号,后面也是一个“@”符号和其参数的字节数。

   我们可以修改一下调用约定,看看是不是这样的。

  

   这样修改之后再看看,可以看到add函数被修饰为_add@16.所以在不同调用约定下修饰规则也是有所不同的。

   

1. C++编译器的函数名修饰规则 

然后,再看看在C++环境下,编译器对我们的函数是怎样修饰的:

        可以看到,对于我声明的double add(double a,double b)函数,被修饰为 (?add@@YANNN@Z),可以看到,这和在C环境中是完全不一样的,所以这也是在C++中有函数重载的原因,那么来看看这到底是怎么修饰的。

 

       C++的函数名修饰规则有些复杂,但是信息更充分,通过分析修饰名不仅能够知道函数的调用方式,返回值类型,参数个数甚至参数类型。不管__cdecl,__fastcall还是__stdcall调用方式,函数修饰都是以一个“?”开始,后面紧跟函数的名字,再后面是参数表的开始标识和按照参数类型代号拼出的参数表。对于__stdcall方式,参数表的开始标识是“@@YG”,对于__cdecl方式则是“@@YA”,对于__fastcall方式则是“@@YI”。参数表的拼写代号如下所示: 
X--void    
D--char    
E--unsigned char    
F--short    
H--int    
I--unsigned int    
J--long    
K--unsigned long(DWORD) 
M--float    
N--double    
_N--bool 
U--struct 

     可以看到N是代表double类型,那么 (?add@@YANNN@Z)就能理解了,函数修饰符?,接着是函数名字,然后是_cdecl约定的开始标示符@@YA然后连着的是返回值类型,参数列表的参数类型刚好是,那么double add(double a,double b)就是NNN,参数表后以“@Z”标识整个名字的结束,如果该函数无参数,则以“Z”标识结束。

    还有当参数列表有指针的时候,指针的方式有些特别,用PA表示指针,用PB表示const类型的指针。后面的代号表明指针类型,如果相同类型的指针连续出现,以“0”代替,一个“0”代表一次重复。

    举一个简单的例子: int fun(int *p1, int *p2);

    

   可以看到,我的fun函数被修饰为(?fun@@YAHPAH0@Z)

   还有在C++中的成员函数中公有和私有的成员函数的修饰也有相应的表示符。总而言之,在C++环境中的函数名修饰的时候,会带有参数列表的信息,还有返回值的信息,所以在C++中的函数重载就是允许存在的,因为它可以根据你的参数列表选择对应的函数,而显然在我们的C环境下是不允许的。

 

以上是关于C++ | 探究函数重载的原理:函数名修饰基于Windows + Linux双系统的主要内容,如果未能解决你的问题,请参考以下文章

__stdcall的名字修饰约定

C++之重载覆盖和隐藏

C++编译器的函数名修饰规则

C++运算符的重载

类中的同名函数关系,重载,覆盖/重写,隐藏

C++面经(持续更新)