图解 Google V8 # 11:堆和栈:函数调用是如何影响到内存布局的?

Posted 凯小默

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图解 Google V8 # 11:堆和栈:函数调用是如何影响到内存布局的?相关的知识,希望对你有一定的参考价值。

说明

图解 Google V8 学习笔记

在编译流水线中的位置

先看三个例子:

1、在同一个任务中重复调用嵌套的 kaimo 函数。

function kaimo() 
	kaimo()

kaimo()

V8 会报栈溢出的错误:

2、使用 setTimeout 让 kaimo 函数在不同的任务中执行。

function kaimo() 
    console.log(1)
	setTimeout(kaimo, 0)

kaimo()

V8 能够正确执行。

3、在同一个任务中执行 kaimo 函数,但是却不是嵌套执行。

function kaimo() 
    console.log(1)
	return Promise.resolve().then(kaimo)

kaimo()

没有栈溢出的错误,页面却出现了卡死的情况。

这相当于在当前这一轮任务里不停地创建微任务,执行,创建,执行,创建……虽然不会爆栈,但也无法去执行下一个任务,主线程被卡在这里了,所以页面会卡死。

有同学说在执行5-10分钟后,Chrome会报错:paused before potential out-of-memory crash,然后当前宏任务继续处于被挂起状态。大家可以试一下,我试了好几次都是浏览器崩溃了,就很离谱。

V8 执行这三种不同代码时,它们的内存布局是不同的,而不同的内存布局又会影响到代码的执行逻辑。

为什么使用栈结构来管理函数调用?

通常函数有两个主要的特性:

  1. 函数可以被调用
  2. 函数具有作用域机制:作用域机制通常表现在函数执行时,会在内存中分配函数内部的变量、上下文等数据,在函数执行完成之后,这些内部数据会被销毁掉。

例子:

int getZ()

    return 4;

int add(int x, int y)

    int z = getZ();
    return x + y + z;

int main()

    int x = 5;
    int y = 6;
    int ret = add(x, y);

上面这段 C 代码执行流程:

  1. 当 main 函数调用 add 函数时,需要将代码执行控制权交给 add 函数;
  2. 然后 add 函数又调用了 getZ 函数,于是又将代码控制权转交给 getZ 函数;
  3. 接下来 getZ 函数执行完成,需要将控制权返回给 add 函数;
  4. 同样当 add 函数执行结束之后,需要将控制权返还给 main 函数;
  5. 然后 main 函数继续向下执行。

函数调用示意图如下:

嵌套调用时函数的生命周期:

函数调用者的生命周期总是长于被调用者(后进),并且被调用者的生命周期总是先于调用者的生命周期结束 (先出)。

函数资源分配流程:

因为函数是有作用域机制的,站在函数资源分配和回收角度来看,被调用函数的资源分配总是晚于调用函数 (后进),而函数资源的释放则总是先于调用函数 (先出)。

函数的生命周期和函数的资源分配情况,它们都符合后进先出 (LIFO) 的策略,而栈结构正好满足这种后进先出 (LIFO) 的需求,所以选择栈来管理函数调用关系是一种很自然的选择。

栈如何管理函数调用?

栈的变化情况是怎样的?

当执行一个函数的时候,栈怎么变化?

例子:

int main()

	int x = 5;
	int y = 6;
	x = 100;
	int z = x + y;
	return z;

函数在执行过程中,其内部的临时变量会按照执行顺序被压入到栈中。

当一个函数调用另外一个函数时,栈的变化情况是怎样的?

int add(num1,num2)
    int x = num1;
    int y = num2;
    int ret = x + y;
    return ret;


int main()

    int x = 5;
    int y = 6;
    x = 100;
    int z = add(x,y);
    return z;

快调用 add 函数时:

调用 add 函数的过程:

当 add 函数执行完成之后,需要将执行代码的控制权转交给 main 函数,这意味着需要将栈的状态恢复到 main 函数上次执行时的状态,我们把这个过程叫恢复现场

怎么恢复 main 函数的执行现场呢?

栈顶指针是在栈操作过程中,有一个专门的栈指针(习惯上称它为TOP),指出栈顶元素所在的位置。

在寄存器中保存一个永远指向当前栈顶的指针即可。

栈顶指针的作用就是告诉你应该往哪个位置添加新元素,这个指针通常存放在 esp 寄存器中。如果你想往栈中添加一个元素,那么你需要先根据 esp 寄存器找到当前栈顶的位置,然后在栈顶上方添加新元素,新元素添加之后,还需要将新元素的地址更新到 esp 寄存器中。

所以当 add 函数执行结束时,只需要将栈顶指针向下移动,就可以恢复 main 函数的执行现场了。

add 函数即将执行结束的状态:

恢复 mian 函数执行现场:

CPU 是怎么知道要移动到这个地址呢?

CPU 的解决方法是增加了另外一个 ebp 寄存器,用来保存当前函数的起始位置,我们把一个函数的起始位置也称为栈帧指针ebp 寄存器中保存的就是当前函数的栈帧指针

ebp 寄存器保存了栈帧指针:

在 main 函数调用 add 函数的时候:

  1. main 函数的栈顶指针就变成了 add 函数的栈帧指针
  2. 需要将 main 函数的栈顶指针保存到 ebp 中

当 add 函数执行结束之后:只需要取出 main 函数的栈顶指针写到 esp 中即可

  1. 需要销毁 add 函数的栈帧
  2. 并恢复 main 函数的栈帧

这就相当于将栈顶指针移动到 main 函数的区域。

如何恢复 main 函数的栈帧指针呢?

每个栈帧对应着一个未运行完的函数,栈帧中保存了该函数的返回地址和局部变量。栈帧也叫过程活动记录。

通常的方法是在 main 函数中调用 add 函数时,CPU 会将当前 main 函数的栈帧指针保存在栈中:

  1. 首先取出 ebp 中的指针,写入 esp 中
  2. 然后从栈中取出之前保留的 main 的栈帧地址,将其写入 ebp 中

这样 ebp 和 esp 就都恢复了,可以继续执行 main 函数了。

和栈空间不同,存放在堆空间中的数据是不要求连续存放的,从堆上分配内存块没有固定模式的,你可以在任何时候分配和释放它。

下面代码中有 new intnew Point 这种语句,当执行这些语句时,表示要在堆中分配一块数据,然后返回指针,通常返回的指针会被保存到栈中。

struct Point

    int x;
    int y;
;


int main()

    int x = 5;
    int y = 6;
    int *z = new int;
    *z = 20;


    Point p;
    p.x = 100;
    p.y = 200;


    Point *pp = new Point();
    pp->y = 400;
    pp->x = 500;
    delete z;
    delete pp;
    return 0;

当 main 函数快执行结束时,堆和栈的状态:

上图中 p 和 pp 都是地址,它们保存在栈中,指向了在堆中分配的空间。

  • C/C++ 这种手动管理内存的语言,如果没有手动销毁堆中的数据,那么就会造成内存泄漏
  • javascript,Java 使用了自动垃圾回收策略,可以实现垃圾自动回收,但也会带来一些性能问题

参考资料

以上是关于图解 Google V8 # 11:堆和栈:函数调用是如何影响到内存布局的?的主要内容,如果未能解决你的问题,请参考以下文章

图解 Google V8 # 17:消息队列:V8是怎么实现回调函数的?

堆和栈

堆和栈的区别详解

图解 Google V8 # 16:V8是怎么通过内联缓存来提升函数执行效率的?

图解 Google V8 # 01:V8 是如何执行一段 JavaScript 代码的?

图解 Google V8 # 05:函数表达式的底层工作机制