JS(单线程)与浏览器(多进程)

Posted YuLong~W

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JS(单线程)与浏览器(多进程)相关的知识,希望对你有一定的参考价值。

进程与线程

1、进程: 进程是CPU资源分配的最小单位

CPU是计算机的核心,承担所有的计算任务

进程 字面意思就是 进行中的程序,可以理解为 一个可以独立运行且拥有自己的资源空间的任务程序

进程包括 运行中的程序程序所使用到的内存和系统资源。当我们启动某个程序时,操作系统会给该程序创建一块内存(当程序关闭时,该内存空间就会被回收),用来存放代码、运行中的数据和一个执行任务的主线程,这样的一个运行环境就叫进程。

多个进程: CPU可以有很多进程,我们的电脑每打开一个软件就会产生一个或多个进程,为什么电脑运行的软件多就会卡,是因为CPU给每个进程分配资源空间,但是一个CPU一共就那么多资源,分出去越多,越卡,每个进程之间是相互独立的,CPU在运行一个进程时,其他的进程处于非运行状态,CPU使用 时间片轮转调度算法 来实现同时运行多个进程


2、线程: 线程是CPU调度的最小单位

线程是建立在进程的基础上的一次程序运行单位,通俗点解释线程就是程序中的一个执行流,一个进程可以有多个线程

因此,线程是依附于进程的,在进程中使用多线程并行处理能提升运算效率,进程将任务分成很多细小的任务,再创建多个线程,在里面并行分别执行

  • 一个进程中只有一个执行流称作 单线程,即程序执行时,所走的程序路径按照连续顺序排下来,前面的必须处理好,后面的才会执行
  • 一个进程中有多个执行流称作 多线程,即在一个程序中可以同时运行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执行的线程来完成各自的任务

3、进程和线程的区别和关系:

区别:

  • 进程是操作系统分配资源的最小单位,线程是程序执行的最小单位
  • 一个进程由一个或多个线程组成,线程可以理解为是一个进程中代码的不同执行路线
  • 进程之间相互独立,但同一进程下的各个线程间共享程序的内存空间(包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号)
  • 调度和切换:线程上下文切换比进程上下文切换要快得多

关系:

  • 一个进程中可以并发多个线程,每个线程并行执行不同的任务
  • 一个进程中的任意一个线程执行出错,会导致这个进程崩溃
  • 同一进程下的线程之间可以直接通信和共享数据
  • 当一个进程关闭之后,操作系统会回收该进程的内存空间

4、多进程和多线程:

多进程: 多进程指的是在同一个时间里,同一个计算机系统中如果允许两个或两个以上的进程处于运行状态。

多线程: 多线程是指程序中包含多个执行流,即在一个程序中可以同时运行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执行的线程来完成各自的任务


JS(单线程)

JS的单线程,与它的用途有关。作为浏览器脚本语言,javascript的主要用途是与用户互动,以及操作DOM。这决定了它只能是单线程,否则会带来很复杂的同步问题。比如,假定JavaScript同时有两个线程,一个线程在某个DOM节点上添加内容,另一个线程删除了这个节点,这时浏览器应该以哪个线程为准,因此这是一个矛盾点,是JS的功能决定了它是单线程语言。

还有人说JS还有Worker线程,为了利用多核CPU的计算能力,HTML5提出Web Worker标准,允许JavaScript脚本创建多个线程,但是 子线程是完全受主线程控制的,而且不得操作DOM

所以,这个标准并没有改变 JavaScript是单线程的本质

详情请了解:JS运行机制


浏览器(多进程)

浏览器是多进程的,拿Chrome来说,每打开一个Tab页就会产生一个进程,使用Chrome打开很多标签页不关,电脑会越来越卡,这是因为消耗了其CPU的缘故。

浏览器包含哪些进程:

Chorme浏览器从关闭到启动,然后新开一个页面至少需要:1个浏览器进程,1个GPU进程,1个网络进程,和1个渲染进程,一共4个进程。

后续如果再打开新的标签页:浏览器进程,GPU进程,网络进程是共享的,不会重新启动,然后默认情况下会为每一个标签页配置一个渲染进程,但是也有例外,比如从A页面里面打开一个新的页面B页面,而A页面和B页面又属于同一站点的话,A和B就共用一个渲染进程,其他情况就为B创建一个新的渲染进程

所以,最新的Chrome浏览器包括:1个浏览器主进程,1个GPU进程,1个网络进程,多个渲染进程,和多个插件进程


1、浏览器进程

  • 主进程:负责协调、控制,只有一个
  • 控制浏览器除标签页外的界面显示,与用户交互,包括地址栏、书签、前进后退按钮等
  • 管理各个页面,创建和销毁其他进程,负责与其他进程的协调工作
  • 将渲染(Renderer)进程得到的内存中的Bitmap(位图),绘制到用户界面上
  • 网络资源的管理,下载,同时提供存储功能等

2、GPU进程:

  • 该进程也只有一个,用于3D绘制等
  • 负责整个浏览器界面的渲染

Chrome刚开始发布的时候是没有GPU进程的,而使用GPU的初衷是为了实现3D、CSS效果,只是后面网页、Chrome的UI界面都用GPU来绘制,这使GPU成为浏览器普遍的需求,最后Chrome在多进程架构上也引入了GPU进程


3、网络进程:

  • 负责发起和接受网络请求

以前是作为模块运行在浏览器进程一时在面的,后面才独立出来,成为一个单独的进程


4、插件进程:

  • 负责插件的运行

因为插件可能崩溃,所以需要通过插件进程来隔离,以保证插件崩溃也不会对浏览器和页面造成影响。

每种类型的插件对应一个进程,当使用该插件时才创建。


5、渲染进程(Renderer):

  • 即通常所说的浏览器内核(Renderer进程,内部是多线程)
  • 每个Tab页面都有一个渲染进程,互不影响
  • 主要作用为页面渲染,脚本执行,事件处理等
  • 负责控制显示tab标签页内的所有内容。核心任务是将html、CSS、JS转为用户可以与之交互的网页,排版引擎Blink和JS引擎V8都是运行在该进程中,

平时看到的浏览器呈现出页面过程中,大部分工作都是在渲染进程中完成


渲染进程中的主要线程

1、GUI渲染线程

  • 1)负责渲染页面,解析 html 和 css、构建DOM树、CSSOM树、渲染树、布局和绘制页面等

    • 解析html代码(HTML代码本质是字符串)转化为浏览器认识的节点,生成DOM树,也就是DOM Tree
    • 解析css代码,生成CSSOM(CSS规则树)
    • 把DOM Tree 和CSSOM结合,生成Rendering Tree(渲染树)
  • 2)当页面需要Repaint和Reflow时,GUI线程将要执行,绘制页面

    • 当修改了一些元素的颜色或者背景色,页面就会重绘(Repaint)
    • 当修改元素的尺寸,页面就会回流(Reflow)
    • 回流(Reflow)比重绘(Repaint)的成本要高,要尽量避免Reflow和Repaint
  • 3)GUI渲染线程与JS引擎线程是互斥的

    • 当JS引擎执行时GUI线程会被挂起(相当于被冻结了)
    • GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行

2、JS引擎线程

浏览器同时只能有一个JS引擎线程在运行JS程序,所以JS是单线程运行的

  • JS引擎线程就是JS内核,负责处理Javascript脚本程序(例如V8引擎)
  • JS引擎线程负责解析Javascript脚本,运行代码
  • JS引擎一直等待着任务队列中任务的到来,然后加以处理
  • 一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序

注意:GUI渲染线程与JS引擎线程是互斥的,JS引擎线程会阻塞GUI渲染线程

常遇到的问题: JS执行时间过长,造成页面的渲染不连贯,导致页面渲染加载阻塞(就是加载慢)

例如:浏览器渲染的时候遇到<script>标签,就会停止GUI的渲染,然后JS引擎线程开始工作,执行里面的JS代码,等JS执行完毕,JS引擎线程停止工作,GUI继续渲染下面的内容。所以如果JS执行时间太长就会造成页面卡顿的情况。


3、定时触发器线程

即为setInterval与setTimeout所在线程

  • 浏览器定时计数器并不是由JavaScript引擎计数的(因为JavaScript引擎是单线程的,如果处于阻塞线程状态就会影响记计时的准确)
  • 通过单独线程来计时并触发定时(计时完毕后,添加到事件触发线程的事件队列中,等待JS引擎空闲后执行),这个线程就是定时触发器线程,也叫定时器线程
  • W3C在HTML标准中规定,规定要求setTimeout中低于4ms的时间间隔算为4ms

4、异步http请求线程

即在XMLHttpRequest在连接后是通过浏览器新开一个线程请求

  • 将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中再由JavaScript引擎执行
  • 简单说就是当执行到一个http异步请求时,就把异步请求事件添加到异步请求线程,等收到响应(准确来说应该是http状态变化),再把回调函数添加到事件队列,等待JS引擎线程空闲时来执行

5、事件触发线程

  • 属于浏览器而不是JS引擎,用来控制事件循环,并且管理着一个事件队列(task queue)。
  • 当JS执行碰到事件绑定和一些异步操作(如setTimeout,也可来自浏览器内核的其他线程,如鼠标点击、AJAX异步请求等),会走事件触发线程将对应的事件添加到对应的线程中(比如定时器操作,便把定时器事件添加到定时器线程),等异步事件有了结果,便把它们的回调操作添加到事件队列,等待JS引擎线程空闲时来处理。
  • 当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待JS引擎的处理
  • 因为JS是单线程,所以这些待处理队列中的事件都得排队等待JS引擎处理

浏览器的进程模型、线程模型

1、进程模型:

以Chrome为例,有四种进程模型,分别是

  • Process-per-site-instance:默认模式。访问不同站点创建新的进程,在旧页面中打开的新页面,且新页面与旧页面属于同一站点的话会共用一个进程不会创建
  • Process-per-site:同一站点使用同一进程
  • Process-per-tab:每一个标签页都创建新的进程 Single
  • Process:单进程模式

2、线程模型:

  • MessagePumpForIO:处理进程间通信的线程,在Chrome中,这类线程都叫做IO线程
  • MessagePumpForUI:处理UI的线程用的
  • MessagePumpDefault:一般的线程用到的

每一个Chrome的线程,入口函数都差不多,都是启动一个消息循环,等待并执行任务


浏览器内多标签页之间通信方式

没有办法直接通信,需要有一个类似中介者进行消息的转发和接收,比如

  • localStorage: 在一个标签页监听localStorage的变化,然后当另一个标签页修改的时候,可以通过监听获取新数据

  • cookie + setInterval: 在A页面将需要传递的信息存储在cookie中,在B页面设置setInterval,以一定的时间去读取cookie的值

  • WebSocket: 因为websocket可以实现实时服务器推送,所以服务器就可以来当这个中介者。标签页通过向服务器发送数据,然后服务器再向其他标签推送转发

  • ShareWorker: 会在页面的生命周期内创建一个唯一的线程,并开启多个页面也只会使用同一个线程,标签页共享一个线程

  • postMessage:

    // 发送方
    window.parent().postMessage('发送的数据','http://接收地址')
    // 接收方
    window.addEventListener('message',(e)=>{ let data = e.data })
    

进程间通信的方式

  • 管道通信: 就是操作系统在内核中开辟一段缓冲区,进程1可以将需要交互的数据拷贝到这个缓冲区里,进程2就可以读取了
  • 消息队列通信: 消息队列就是用户可以添加和读取消息的列表,消息队列里提供了一种从一个进程向另一个进程发送数据块的方法,不过和管道通信一样每个数据块有最大长度限制
  • 共享内存通信: 就是映射一段能被其他进程访问的内存,由一个进程创建,但多个进程都可以访问,共享进程最快的是 IPC方式
  • 信号量通信: 比如信号量初始值是1,进程1来访问一块内存的时候,就把信号量设为0,然后进程2也来访问的时候看到信号量为0,就知道有其他进程在访问了,就不访问了
  • socket: 其他的都是同一台主机之间的进程通信,而在不同主机的进程通信就要用到socket的通信方式了,比如发起http请求,服务器返回数据

拓展知识:

孤儿进程: 故名思义,就是没爹的孩子。父进程退出了,而它的一个或多个进程还在运行,那么这些子进程都会成为孤儿进程。这些孤儿都将被init进程收养,并负责这些孤儿的以后

僵尸进程: 就是子进程比父进程先结束,而父进程又没有释放子进程占用的资源,那么子进程的描述还留在系统中,这种进程就是僵尸进程

参考优秀文章:

「硬核JS」一次搞懂JS运行机制

深入理解浏览器中的进程与线程

以上是关于JS(单线程)与浏览器(多进程)的主要内容,如果未能解决你的问题,请参考以下文章

从浏览器多进程到JS单线程,JS运行机制最全面的一次梳理

线程机制与事件机制:进程与线程 浏览器内核 定时器引发的思考 JS是单线程执行的 浏览器的事件循环(轮询)模型

从浏览器多进程到JS单线程,JS运行机制最全面的一次梳理(转)

从浏览器多进程到JS单线程,JS运行机制最全面的一次梳理

js异步——事件循环和消息队列

Event Loop详解