[C++ 提高] --- 类的存储 和 包含虚函数的类

Posted Overboom

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[C++ 提高] --- 类的存储 和 包含虚函数的类相关的知识,希望对你有一定的参考价值。

1 从内存四区的角度分析类的存储

如果一个类包括了数据和函数,用这个类去实例化对象时,系统会为每一个对象分配存储空间。每个对象所占用的存储空间只是该对象的数据部分(虚函数指针和虚基类指针也属于数据部分)所占用的存储空间,而不包括函数代码所占用的存储空间。
C++编译系统会用一段空间来存放这个共同的函数代码段,在调用各对象的函数时,都去调用这个公用的函数代码。

  C++程序的内存格局通常分为四个区:全局数据区(data area),代码区(code area),栈区(stack area),堆区(heap area)(即自由存储区)。
  全局数据区存放全局变量,静态数据和常量;
  所有类成员函数和非成员函数代码存放在代码区;
  为运行函数而分配的局部变量、函数参数、返回数据、返回地址等存放在栈区;
  余下的空间都被称为堆区。

  根据这个解释,我们可以得知在类的定义时,类成员函数是被放在代码区,而类的静态成员变量在类定义时就已经在全局数据区分配了内存,因而它是属于类的。对于非静态成员变量,我们是在类的实例化过程中(构造对象)才在栈区或者堆区为其分配内存,是为每个对象生成一个拷贝,所以它是属于对象的。
  应当说明,常说的“某某对象的成员函数”,是从逻辑的角度而言的,而成员函数的存储方式,是从物理的角度而言的,二者是不矛盾的。

2 C++类分析

2.1 C++类的构成

类由两部分构成:

  • 数据成员:简单类型[char/short/long/int/double/float等]、复合类型[结构体/枚举/类类型等]
  • 函数成员:虚函数、非虚函数

2.2 数据成员的存储方式 - 内存对其原则

复合类型由简单类型组成,简单类型对其原则同C语言结构体内存对其原则,很早之前已经写过,可以参看here,这里进行简单回顾。
简单类型在类的对象中对齐方式,以字节为单位进行存储。

char 1
short 2
long 4
int 4
float 4
fouble 8

取类中最长的数据成员作为对齐原则。例如,类中最长为 double,那么就是8 个字节。

2.3 函数成员的存储方式

非虚函数是存放在代码区的,不占用类的存储空间。
在一个类的某个函数前加上virtual关键字,这个函数就变成了虚函数。编译器处理虚函数的方法是:为每个类对象添加一个隐藏成员,隐藏成员中保存了一个指向函数地址数组的指针,称为虚表指针(vptr),这种数组成为虚函数表(virtual function table, vtbl),即,每个类使用一个虚函数表,每个类对象用一个虚表指针。

2.4 实例验证类大小

读完上面的分析,现在来看示例代码,进行验证

代码示例

#include <iostream>

/*******************Test1***********************/
class Test1 
public:
    Test1();
    ~Test1();

public:
    int n1;
    char c1;
    short s1;

private:
    int n2;
    char c2;
    short s2;
;

Test1::Test1()




Test1::~Test1()

	

/*******************Test1 end***********************/

/*******************Test2***********************/
class Test2 
public:
    Test2();
    ~Test2();

    void func0();

    friend void func1();

    void func2() const ;

    inline void func3() ;

    static void func4() ;

    // virtual void func5();

public:
    int n1;
    char c1;
    short s1;

private:
    int n2;
    char c2;
    short s2;
;

Test2::Test2()




Test2::~Test2()

	


void Test2::func0()




void func1()





void Test2::func2() const




inline void Test2::func3()




void Test2::func4()




// void Test2::func5()
// 

// 

/*******************Test2 end***********************/
int main(void)

	Test1 test1_;
	Test2 test2_;

	printf("sizeof test1 = %ld\\n", sizeof(test1_));
	printf("sizeof test2 = %ld\\n", sizeof(test2_));

	return 0;


编译输出:

打开注释之后,编译输出【测试机器为x64】:

总结:

  • C++编译系统中,数据和函数是分开存放的(函数放在代码区;数据主要放在栈区和堆区,静态/全局区以及文字常量区也有),实例化不同对象时,只给数据分配空间,各个对象调用函数时都都跳转到(内联函数例外)找到函数在代码区的入口执行,可以节省拷贝多份代码的空间
  • 类的静态成员变量编译时被分配到静态/全局区,因此静态成员变量是属于类的,所有对象共用一份,不计入类的内存空间
  • 静态成员函数和非静态成员函数都是存放在代码区的,是属于类的,类可以直接调用静态成员函数,不可以直接调用非静态成员函数,两者主要的区别是有无this指针
  • 存在虚函数的类,会对应一个虚函数表,实例化对象时,每个对象会占用一个虚表指针

3 包含虚函数的类

3.1 概述

简单地说,每一个含有虚函数(无论是其本身的,还是继承而来的)的类都至少有一个与之对应的虚函数表,其中存放着该类所有的虚函数对应的函数指针。例:

其中:
B的虚函数表中存放着B::foo和B::bar两个函数指针。
D的虚函数表中存放的既有继承自B的虚函数B::foo,又有重写(override)了基类虚函数B::bar的D::bar,还有新增的虚函数D::quz。

3.2 虚函数表构造的过程

从编译器的角度来说,B的虚函数表很好构造,D的虚函数表构造过程相对复杂。下面给出了构造D的虚函数表的一种方式(仅供参考):

3.3 虚函数调用过程

以下面的程序为例:

编译器只知道pb是B*类型的指针,并不知道它指向的具体对象类型 :pb可能指向的是B的对象,也可能指向的是D的对象。

但对于“pb->bar()”,编译时能够确定的是:此处operator->的另一个参数是B::bar(因为pb是B*类型的,编译器认为bar是B::bar),而B::bar和D::bar在各自虚函数表中的偏移位置是相等的。

无论pb指向哪种类型的对象,只要能够确定被调函数在虚函数中的偏移值,待运行时,能够确定具体类型,并能找到相应vptr了,就能找出真正应该调用的函数。

以上是关于[C++ 提高] --- 类的存储 和 包含虚函数的类的主要内容,如果未能解决你的问题,请参考以下文章

9-2:C++多态之纯虚函数和抽象类以及接口继承和实现继承

c++多态及虚函数表内部原理实战详解

深入C++对象模型&虚函数表

c++基础知识

C++子类如何调父类的虚函数

关于C++的虚函数在父类的内部调用