C++之:虚函数表

Posted This is bill

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++之:虚函数表相关的知识,希望对你有一定的参考价值。

一、文章来由

虚函数表究竟存放在哪里?

二、概念

C++中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法。比如:模板技术,RTTI技术,虚函数技术,要么是试图做到在编译时决议,要么试图做到运行时决议。

对C++ 了解的人都应该知道虚函数(Virtual Function)是通过一张虚函数表(Virtual Table)来实现的。简称为V-Table。在这个表中,主是要一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其容真实反应实际的函数。这样,在有虚函数的类的实例中这个表被分配在了这个实例的内存中,所以,当我们用父类的指针来操作一个子类的时候,这张虚函数表就显得由为重要了,它就像一个地图一样,指明了实际所应该调用的函数。这里我们着重看一下这张虚函数表。C++的编译器应该是保证:虚函数表的指针存在于对象实例中最前面的位置(这是为了保证取到虚函数表的有最高的性能——如果有多层继承或是多重继承的情况下)。 这意味着我们通过对象实例的地址得到这张虚函数表,然后就可以遍历其中函数指针,并调用相应的函数。

class Base {
public:
    virtual void f() { cout << "Base::f" << endl; }
    virtual void g() { cout << "Base::g" << endl; }
    virtual void h() { cout << "Base::h" << endl; }

};

int main()
{
    //freopen("input.txt","r",stdin);

    typedef void(*Fun)(void); 
    Base b;

    Fun pFun = NULL;

    cout << "虚函数表地址:" << (int*)(&b) << endl;
    cout << "虚函数表 — 第一个函数地址:" << (int*)(*(int*)(&b)) << endl;

    // Invoke virtual functions

    pFun = (Fun)*((int*)*(int*)(&b));  // Base::f()
    pFun();
    pFun = (Fun)*((int*)*(int*)(&b)+1);  // Base::g()
    pFun();
    pFun = (Fun)*((int*)*(int*)(&b)+2);  // Base::h()
    pFun();

    return 0;
}

vs2012 环境下输出:

这里写图片描述

通过这个示例,我们可以看到,我们可以通过强行把 &b 转成 int*,取得虚函数表的地址,然后,再次取址就可以得到第一个虚函数的地址了,也就是Base::f(),这在上面的程序中得到了验证(把int* 强制转成了函数指针)。

Base 实例虚表结构图如下:

这里写图片描述

注意:在上面这个图中,虚函数表的最后多加了一个结点,这是虚函数表的结束结点,就像字符串的结束符“/0”一样,其标志了虚函数表的结束。这个结束标志的值在不同的编译器下是不同的。在WinXP+VS2003下,这个值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,这个值是如果1,表示还有下一个虚函数表,如果值是0,表示是最后一个虚函数表。

而且,只要继承父类的虚函数,其子类不论写不写virtual都是虚函数。

class Base {
public:
    virtual void f() { cout << "Base::f" << endl; }

};

class Base2 : public Base{
public:
    void f() { cout << "Base2::f" << endl; }
};

class Derive : public Base2{

public:
    void f() { cout << "Derive::f" << endl; }
};

typedef void(*Fun)(void);

int main() {
    Base2 *b2 = new Derive;

    b2->f();

    return 0;
}

输出:
Derive::f

三、不同情况下的虚表

下面没有覆盖父类的虚函数是毫无意义的。之所以要讲述没有覆盖的情况,主要目的是为了给一个对比。在比较之下,可以更加清楚地知道其内部的具体实现。

1、一般继承(无虚函数覆盖)

这里写图片描述

对于实例:Derive d; 的虚函数表如下

这里写图片描述

1)虚函数按照其声明顺序放于表中。

2)父类的虚函数在子类的虚函数前面。

2、一般继承(有虚函数覆盖)

这里写图片描述

对于派生类的实例,其虚函数表为

这里写图片描述

1)覆盖的f()函数被放到了虚表中原来父类虚函数的位置。

2)没有被覆盖的函数依旧。

3、多重继承(无虚函数覆盖)

这里写图片描述

对于子类实例中的虚函数表为

这里写图片描述

1) 每个父类都有自己的虚表。

2) 子类的成员函数被放到了第一个父类的表中。(所谓的第一个父类是按照声明顺序来判断的)

4、多重继承(有虚函数覆盖)

这里写图片描述

子类虚函数结构

这里写图片描述

    Derive d;
    Base1 *b1 = &d;
    Base2 *b2 = &d;
    Base3 *b3 = &d;
    b1->f(); //Derive::f()
    b2->f(); //Derive::f()
    b3->f(); //Derive::f()

    b1->g(); //Base1::g()
    b2->g(); //Base2::g()
    b3->g(); //Base3::g()

问:那子类和父类虚函数表维护的是一样的吗?或者说上面子类自己的虚函数放在自己的表中吗?

class Base {
public:
    virtual void f() { cout << "Base::f" << endl; }
    virtual void g() { cout << "Base::g" << endl; }
};

class Derive:public Base
{
public:
    void f(){ cout << "Derive::f" << endl; }
    virtual void f1() { cout << "Derive::f1" << endl; }

};

int main()
{
    //freopen("input.txt","r",stdin);

    typedef void(*Fun)(void);

    Base b;
    Fun bFun = (Fun)*((int*)*(int*)(&b));
    bFun();
    bFun = (Fun)*((int*)*(int*)(&b)+1);
    bFun();
    cout<<bFun<<endl;

    Derive d;
    Fun dFun = (Fun)*((int*)*(int*)(&d));
    dFun();
    dFun = (Fun)*((int*)*(int*)(&d)+1);
    dFun();
    dFun = (Fun)*((int*)*(int*)(&d)+2);
    dFun();
    cout<<dFun<<endl;

    return 0;
}

四、虚函数表安全性

1、通过父类型的指针访问子类自己的虚函数

我们知道,子类没有覆盖父类的虚函数是一件毫无意义的事情。虽然在上面的图中我们可以看到 Base1 的虚表中有Derive的虚函数,但我们根本不可能使用下面的语句来调用子类的自有虚函数:

Base1 *b1 = new Derive();
b1->f1();  //编译出错

任何妄图使用父类指针想调用子类中的未覆盖父类的成员函数的行为都会被编译器视为非法,所以,这样的程序根本无法编译通过。但在运行时,我们可以通过指针的方式访问虚函数表来达到违反C++语义的行为。

下面的例子就可以做到。

下面是一个关于多重继承的虚函数表访问的例程:

#include <iostream>
using namespace std;

class Base1 {
public:
            virtual void f() { cout << "Base1::f" << endl; }
            virtual void g() { cout << "Base1::g" << endl; }
            virtual void h() { cout << "Base1::h" << endl; }

};

class Base2 {
public:
            virtual void f() { cout << "Base2::f" << endl; }
            virtual void g() { cout << "Base2::g" << endl; }
            virtual void h() { cout << "Base2::h" << endl; }
};

class Base3 {
public:
            virtual void f() { cout << "Base3::f" << endl; }
            virtual void g() { cout << "Base3::g" << endl; }
            virtual void h() { cout << "Base3::h" << endl; }
};


class Derive : public Base1, public Base2, public Base3 {
public:
            virtual void f() { cout << "Derive::f" << endl; }
            virtual void g1() { cout << "Derive::g1" << endl; }
};


typedef void(*Fun)(void);

int main()
{
            Fun pFun = NULL;

            Derive d;
            int** pVtab = (int**)&d;

            //Base1's vtable
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+0);
            pFun = (Fun)pVtab[0][0];
            pFun();

            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+1);
            pFun = (Fun)pVtab[0][1];
            pFun();

            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+2);
            pFun = (Fun)pVtab[0][2];
            pFun();

            //Derive's vtable
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+3);
            pFun = (Fun)pVtab[0][3];
            pFun();

            //The tail of the vtable
            pFun = (Fun)pVtab[0][4];
            cout<<pFun<<endl;


            //Base2's vtable
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0);
            pFun = (Fun)pVtab[1][0];
            pFun();

            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1);
            pFun = (Fun)pVtab[1][1];
            pFun();

            pFun = (Fun)pVtab[1][2];
            pFun();

            //The tail of the vtable
            pFun = (Fun)pVtab[1][3];
            cout<<pFun<<endl;



            //Base3's vtable
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0);
            pFun = (Fun)pVtab[2][0];
            pFun();

            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1);
            pFun = (Fun)pVtab[2][1];
            pFun();

            pFun = (Fun)pVtab[2][2];
            pFun();

            //The tail of the vtable
            pFun = (Fun)pVtab[2][3];
            cout<<pFun<<endl;

            return 0;
}

2、访问non-public的虚函数

另外,如果父类的虚函数是private或是protected的,但这些非public的虚函数同样会存在于虚函数表中,所以,我们同样可以使用访问虚函数表的方式来访问这些non-public的虚函数,这是很容易做到的。

如:

class Base {
    private:
            virtual void f() { cout << "Base::f" << endl; }

};

class Derive : public Base{

};

typedef void(*Fun)(void);

void main() {
    Derive d;
    Fun  pFun = (Fun)*((int*)*(int*)(&d)+0);
    pFun();
}

VC查看虚函数表

我们可以在VC的IDE环境中的Debug状态下展开类的实例就可以看到虚函数表了(并不是很完整的)

这里写图片描述

附:基础回顾

1、多态

概念:

多态性就是指同样的消息被类的不同的对象接收时导致的完全不同的行为的一种现象。这里所说的消息即对类成员函数的调用。多态实质是一个函数名称的多种形态。

C++两种类型多态:

(1)编译时多态是通过静态联编实现的;

(2)运行时多态则是通过动态联编实现的。

函数联编:

对一个函数的调用,在编译或运行时确定将其连接到相应的函数体的代码,实质是把一个标示名与一个存储地址(函数代码段入口)联系在一起的过程。

2、虚函数

C++中的动态联编是通过虚函数实现的,虚函数必须存在于继承的环境下。

当一个类的成员函数说明为虚函数后,就可以在该类的(直接或间接)派生类中定义与其基类虚函数原型相同注意是函数原型一定要完全相同,否则会隐藏该虚函数)的函数。

虚函数可以在一个或多个派生类中被重新定义,要求在派生类中重新定义时,必须与基类中的函数原型完全相同,包括函数名、返回类型、参数个数和参数类型的顺序。这时无论在派生类的相应成员函数前是否加上关键字virtual,都将视其为虚函数,如果函数原型不同,只是函数名相同,C++将视其为一般的函数重载,而不是虚函数。只有类的成员函数才能声明为虚函数,全局函数及静态成员函数不能声明为虚函数。

3、纯虚函数

纯虚函数是在基类中只声明虚函数而不给出具体的函数定义体,将它的具体定义放在各派生类中,称此虚函数为纯虚函数。

通过该基类的指针或引用就可以调用所有派生类的虚函数,基类只是用于继承,仅作为一个接口,具体功能在派生类中实现.

纯虚函数的声明如下:(注:要放在基类的定义体中)

   virtual 函数原型=0;

注意:

(1)声明了纯虚函数的类,称为抽象类;

(2)抽象类中可以有多个纯虚函数;

(3)不能声明抽象类的对象,但可以声明指向抽象类的指针变量和引用变量

(4)抽象类也可以定义其他非纯虚函数;

(5)如果派生类中没有重新定义基类中的纯虚函数,则在派生类中必须再将该虚函数声明为纯虚函数;

(6)从抽象类可以派生出具体或抽象类,但不能从具体类派生出抽象类(这条在vs2012上实验是错误的,详见后面代码);

(7)在一个复杂的类继承结构中,越上层的类抽象程度越高,有时甚至无法给出某些成员函数的实现,显然,抽象类是一种特殊的类,它一般处于类继承结构的较外层;

(8)引入抽象类的目的,主要是为了能将相关类组织在一个类继承结构中,并通过抽象类来为这些相关类提供统一的操作接口。

验证第六条:

class Base {
public:
    void f() { cout << "Base::f" << endl; }

};

class Base2 : public Base{
public:
    virtual void g()=0;
};

class Derive : public Base2{

public:
    void g() { cout << "Derive::g" << endl; }
};

int main() {
    Base2 *b2 = new Derive;

    b2->f();
    b2->g();

    return 0;
}

最后输出:
Base::f
Derive::g

说明也可以从具体类派生抽象类。

c++纯虚函数调用

Inside the C++ Object Model

首先,必须清楚的是纯虚函数本身是不应该被调用的!因为纯虚函数是用来定义接口的,有时候基类自己找不到一个合情合理的实现,所以用虚函数的形式声明,让他的子类去做具体的实现。因此,如果纯虚函数被调用了,那一定是你的程序里出现了逻辑上的错误,这是我们在工作中需要了解和避免的。

class Base{
public:
    virtual void foo()=0;
    Base()   { foo();  }    // 调用纯虚函数
};
class Derived: Base{
    void foo() {  }
};
int main() {
    Derived d;
}

很幸运的,编译器能发现错误并向你吐槽,以下是我使用CodeBlocks(自带MinGw的,含基于gcc 4.7.1的编译器)编译得到的一个警告和一个链接错误:

编译警告:warning: pure virtual 'virtual void Base::foo()' called from constructor
链接错误:undefined reference to `Base::foo()'

但是很不幸的,实际的应用中代码往往复杂得多,使得编译器无法在编译的时候发现问题。修改上面的代码如下,就可以成功的调用到虚函数了:

class Base{
public:
    virtual void foo()=0;
    Base() { call_foo();}
    void call_foo() { foo(); }
};

class Derived: Base{
    void foo() {  }
};

int main() {
    Derived d;
}

运行后得到的结果为:

这里写图片描述

总结起来,其实还是

“Item 9: Never call virtual functions during construction or destruction.” ( The third edition of Scott Meyers’ popular book, Effective C++).

最后顺便提一下,在 C++ 11 的标准文档【ISO/IEC 14882:2011(E)】中,也有相关的描述:

(10.4.6)” Member functions can be called from a constructor (or destructor) of an abstract class; the effect of making a virtual call (10.3) to a pure virtual function directly or indirectly for the object being created (or destroyed) from such a constructor (or destructor) is undefined.”

也就是说,纯虚函数调用的行为是未定义的,而 gcc 的默认实现则是终止程序,输出相关的信息。

参考链接:
http://www.artima.com/cppsource/nevercall.html
http://blogs.msdn.com/b/oldnewthing/archive/2004/04/28/122037.aspx
参考书籍:
Effective C++, 3rd Edition, Scott Meyers
ISO/IEC 14882:2011(E)


参考资料

[1] http://my.oschina.net/hnuweiwei/blog/280894?fromerr=4qwE4QQr

[2] http://blog.csdn.net/haoel/article/details/1948051

[3] http://www.cnblogs.com/Pony279/archive/2013/06/04/3117955.html

以上是关于C++之:虚函数表的主要内容,如果未能解决你的问题,请参考以下文章

c++ 之 内存模型:虚函数篇

C++性能榨汁机之虚函数的开销

9-4:C++多态之单继承和多继承中的虚函数表

C++之多态总结(多态的定义及实现,抽象类,多态原理,单继承,多继承中的虚函数表)

C++ 面向对象程序三大特性之 多态

硬核两万字带你理解C++之多态