C++多态深度剖析

Posted Fireplusplus

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++多态深度剖析相关的知识,希望对你有一定的参考价值。

测试环境:

Target: x86_64-linux-gnu

gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2.1)


什么是多态?

多态一词最初来源于希腊语,意思是具有多种形式或形态的情形,当然这只是字面意思,它在C++语言中多态有着更广泛的含义。

这要先从对象的类型说起!对象的类型有两种:

                

举个栗子:Derived1类和Derived2类继承Base类

class Base
{};

class Derived1 : public Base
{};

class Derived2 : public Base
{};

int main()
{
	Derived1 pd1 = new Derived1; //pd1的静态类型为Derived1,动态类型为Derived1
	Base *pb = pd1; //pb的静态类型为Base,动态类型现在为Derived1
	Derived2 pd2 = new Derived2; //pd2的静态类型为Derived2,动态类型现在为Derived2
	pb = pd2; //pb的静态类型为Base,动态类型现在为Derived2

	return 0;
}
对象有静态类型,也有动态类型,这就是一种类型的多态。


多态分类

多态有静态多态,也有动态多态,静态多态,比如函数重载,能够在编译器确定应该调用哪个函数;动态多态,比如继承加虚函数的方式(与对象的动态类型紧密联系,后面详解),通过对象调用的虚函数是哪个是在运行时才能确定的。

                                  

【静态多态】

栗子:函数重载

long long Add(int left, int right)
{
	return left + right;
}

double Add(float left, float right)
{
	return left + right;
}

int main()
{
	cout<<Add(10, 20)<<endl; //语句一
	cout<<Add(12.34f, 43.12f)<<endl; //语句二

	return 0;
}
运行结果:

                   

编译器在编译期间完成的,编译器根据函数实参的类型(可能会进行隐式类型转换),即可推断出要调用哪个函数,如果有对应的函数就调用该函数,否则出现编译错误。

【动态多态】

进入动态多态前,先看一个普通继承的栗子:

class Person
{
public:
	void GoToWashRoom()
	{
		cout<<"Person-->?"<<endl;
	}
};

class Man : public Person
{
public:
	void GoToWashRoom()
	{
		cout<<"Man-->Please Left"<<endl;
	}
};

class Woman : public Person
{
public:
	void GoToWashRoom()
	{
		cout<<"Woman-->Please Right"<<endl;
	}
};

int main()
{
	Person per, *pp;
	Man man, *pm;
	Woman woman, *pw;

	pp = &per;
	pm = &man;
	pw = &woman;
	
	//第一组		//这些都是毫无疑问的
	per.GoToWashRoom();	//调用基类Person类的函数
	pp->GoToWashRoom();	//调用基类Person类的函数
	man.GoToWashRoom();	//调用派生类Man类的函数 
	pm->GoToWashRoom();	//调用派生类Man类的函数 
	woman.GoToWashRoom();	//调用派生类Woman类的函数 
	pw->GoToWashRoom();	//调用派生类Woman类的函数 
	
	//第二组
	pp = &man;
	pp->GoToWashRoom();	//调用基类Person类的函数
	pp = &woman;
	pp->GoToWashRoom();	//调用基类Person类的函数
	
	return 0;
}
运行结果:

                   

第一组毫无疑问,通过本类对象和本类对象的指针就是调用本类的函数;第二组中先让基类指针指向子类对象,然后调用该函数,调用的是子类的,后让基类指针指向另一个子类对象,调用的是子类的函数。这是因为p的类型是一个基类的指针类型,那么在p看来,它指向的就是一个基类对象,所以调用了基类函数。就像一个int型的指针,不论它指向哪,读出来的都是一个整型(在没有崩溃的前提下),即使将它指向一个float。再来对比着看下一个栗子。

栗子:继承+虚函数

class Person
{
public:
	virtual void GoToWashRoom() = 0;
};

class Man : public Person
{
public:
	virtual void GoToWashRoom()
	{
		cout<<"Man-->Please Left"<<endl;
	}
};

class Woman : public Person
{
public:
	virtual void GoToWashRoom()
	{
		cout<<"Woman-->Please Right"<<endl;
	}
};

int main()
{
	for (int i = 0; i < 10; i++)
	{
		Person *p;
		if (i&0x01)
			p = new Man;
		else
			p = new Woman;

		p->GoToWashRoom();
		delete p;
		sleep(1);
	}

	return 0;
}
运行结果:

                   

就像上边这个栗子所演示的那样,通过重写虚函数(不再是普通的成员函数,是虚函数!),实现了动态绑定,即在程序执行期间(非编译期)判断所引用对象的实际类型,根据其实际类型调用相应的方法。使用virtual关键字修饰函数时,指明该函数为虚函数(在栗子中为纯虚函数),派生类需要重新实现,编译器将实现动态绑定。在上边栗子中,当指针p指向Man类的对象时,调用了Man类自己的函数,p指向Woman类对象时,调用了Woman类字几的函数。

今天的重点来了,就是要分析这个动态绑定实现的原理(以下测试在VS2013环境下进行):

为了方便调试,我将程序修改如下:

class Person
{
public:
	void GoToWashRoom()
	{};
};

class Man : public Person
{
public:
	void GoToWashRoom()
	{
		cout << "Man-->Please Left" << endl;
	}
};

int main()
{
	cout << sizeof(Person) << endl;
	cout << sizeof(Person) << endl;
	return 0;
}
先求一下两个普通的继承类的大小,在这里为空类,没有包含成员变量,所以为1,表示占位:

                   

假如基类中包含一个int型变量,那么这里的大小都会是4。这不是今天的重点,不再叙说。主要是想看看普通空类的大小。

再改一下程序,在基类的成员函数前加virtual关键字,将这个函数变为虚函数。

class Person
{
public:
	virtual void GoToWashRoom()
	{};
};
其它部分代码不变,运行结果:

                    
大小变成了4.所以这个类里面肯定是有什么东西的。

在main中加入以下代码:

Man man;

Person *p = &man;
p->GoToWashRoom();

查看监视窗口:

                   

man对象里存在了一个指针,而且是void**类型的,那么这个指针指向哪呢?可以在内存中查看一下这个地址所在内存中的内容。

                   

是一个可能是地址的东西,然后下边是一排的 00 00 00 00,貌似相当于NULL。继续看一下这个类似于地址的东西里面又是什么:

                  

嗯,看不懂,不要紧,把这个数字记下来:0x01 27 13 de

继续运行程序,转到反汇编:

                   

这两句取到man的首地址然后通过eax寄存器赋值给p,这样p就指向了man对象。目前对象模型是这样的:

                   

同时,_vfptr的值为0x01 27 13 de。接下来就要准备调用函数了。

                   

一句句分析:

01276036  mov         eax,dword ptr [p]    //从p所指位置取4个字节内容放到eax,其实就是取的man对象的地址:0x008BFC1C
01276039  mov         edx,dword ptr [eax]  //从eax所指位置取4个字节内容放到edx,就是我们之前看到的不明变量_vfptr的值:0x0127dc80
0127603B  mov         esi,esp  //这句先不用管,esp是栈顶指针
0127603D  mov         ecx,dword ptr [p]  //将对象地址给ecx也保存了一份,此时ecx和eax放的都是对象地址(其实这句就是调用函数之前通过ecx传递this指针)
01276040  mov         eax,dword ptr [edx]  //取对象前四个字节给eax,eax和edx都变成了_vfptr的值。
01276042  call        eax  //调用函数,函数地址在eax中,说明_vfptr指向的内容是函数的地址
01276044  cmp         esi,esp  
01276046  call        __RTC_CheckEsp (01271334h) 
到call这条语句跟进去看一下:

                    

这下明白了吧,其实_vfptr存放的内容就是存放函数地址的地址,即_vfptr指向函数地址所在的内存空间,如图:

                  

分析暂告一段落。我们知道了man对象中维护了一个虚表指针,虚表中存放着虚函数的地址。基于这个虚表指针,实现动态绑定,才可以用基类指针调用了Man类中的虚函数。因为指针p看到的是虚表的指针,它调用的虚函数是从虚表中查找的。如果基类中有多个虚函数的话,那么虚表中也会依次按基类中虚函数定义顺序存放虚函数的地址,并以0x 00 00 00 00 结尾。再如果子类中有自己定义的新的虚函数,那么会排在虚函数表的后边。在调用虚函数时由编译器自动计算偏移取得相应的虚函数地址。

看看是如何构造子类对象的:

class Person
{
public:
	Person()
	{
		cout << "Person()" << endl;
	}
	~Person()
	{
		cout << "~Person()" << endl;
	}

	virtual void GoToWashRoom()
	{};
};

class Man : public Person
{
public:
	Man()
	{
		cout << "Man()" << endl;
	}
	~Man()
	{
		cout << "~Man()" << endl;
	}

	void GoToWashRoom()
	{
		cout << "Man-->Please Left" << endl;
	}
};

int main()
{
	Man man;

	return 0;
}
运行结果:

                   

先调用基类构造函数,虚表指针先指向基类虚表,然后调用子类构造函数,这时候子类对象的虚表指针就指向了子类自己的虚表。这才是动态绑定实现原理。详细内容可以查看反汇编,这里不再写了。

再举个栗子看看虚表指针在对象的首部还是尾部,又或者是在中间某个地方存放:

class Person
{
public:
	virtual void GoToWashRoom()
	{};
public:
	int i1;
	int i2;
	int i3;
};

class Man : public Person
{
	void GoToWashRoom()
	{
		cout << "Man-->Please Left" << endl;
	}
};

int main()
{
	Man man;
	man.i1 = 0x01;
	man.i2 = 0x02;
	man.i3 = 0x03;

	return 0;
}
查看内存中:&man

                   

可以看出,虚表指针位于对象的首部。

【动态绑定条件】

  1. 必须是虚函数
  2. 通过基类类型的引用或者指针调用

总结

  1. 派生类重写基类的虚函数实现多态,要求函数名、参数列表、返回值完全相同。(协变除外)
  2. 基类中定义了虚函数,在派生类中该函数始终保持虚函数的特性
  3. 只有类的成员函数才能定义为虚函数,静态成员函数不能定义为虚函数
  4. 如果在类外定义虚函数,只能在声明函数时加virtual关键字,定义时不用加
  5. 构造函数不能定义为虚函数,虽然可以将operator=定义为虚函数,但最好不要这么做,使用时容 易混淆
  6. 不要在构造函数和析构函数中调用虚函数,在构造函数和析构函数中,对象是不完整的,可能会 出现未定义的行为
  7. 最好将基类的析构函数声明为虚函数。(析构函数比较特殊,因为派生类的析构函数跟基类的析构 函数名称不一样,但是构成覆盖,这里编译器做了特殊处理)
  8. 虚表是所有类对象实例共用的

    //协变,也可以构成重写(覆盖),但返回值是该类类型的指针或引用
    class Base   
    {       
        virtual Base * FunTest()  
        {  
            //do something  
        }  
    };  
    class Derived : public Base  
    {  
        Derived * FunTest()  
        {  
            //do something  
        }  
    };   


容易混淆的点:

                 


以上是关于C++多态深度剖析的主要内容,如果未能解决你的问题,请参考以下文章

C++多态底层剖析

C++多态底层剖析

C++多态底层剖析

C++静态多态与动态多态的实现原理剖析

C++静态多态与动态多态的实现原理剖析

c++类模板深度剖析