首页 > 技术文章 > 浏览器加载、解析、渲染的过程

sunli0205 2017-02-20 21:07 原文

为什么要了解浏览器加载、解析、渲染这个过程?

1.了解浏览器加载,可以在引用外部样式文件,外部js时,将他们放到合适的位置,使浏览器以最快的速度将文件加载完毕

2.了解浏览器解析,可以在构建DOM结构,组织css选择器时,选择最优的写法,提高浏览器的解析速率。

3.了解浏览器渲染,明白渲染的过程,我们在设置元素属性,编写js文件时,可以减少”重绘“”重新布局“的消耗。

浏览器是如何进行加载、解析、渲染的呢?

浏览器的主要功能是将用户选择的web资源呈现出来,它需要从服务器请求资源,并将其显示在浏览器窗口中,资源的格式通常是HTML,也包括PDF、image及其他格式。用户用URI(Uniform Resource Identifier统一资源标识符)来指定所请求资源的位置,通过DNS查询,将网址转换为IP地址。整个浏览器工作的流程,之前博客中有论述: 
  1、输入网址。 
  2、浏览器查找域名的IP地址。 
  3. 浏览器给web服务器发送一个HTTP请求 
  4. 网站服务的永久重定向响应 
  5. 浏览器跟踪重定向地址 现在,浏览器知道了要访问的正确地址,所以它会发送另一个获取请求。 
  6. 服务器“处理”请求,服务器接收到获取请求,然后处理并返回一个响应。 
  7. 服务器发回一个HTML响应 
  8. 浏览器开始显示HTML 
  9. 浏览器发送请求,以获取嵌入在HTML中的对象。在浏览器显示HTML时,它会注意到需要获取其他地址内容的标签。这时,浏览器会发送一个获取请求来重新获得这些文件。这些文件就包括CSS/JS/图片等资源,这些资源的地址都要经历一个和HTML读取类似的过程。所以浏览器会在DNS中查找这些域名,发送请求,重定向等等…

还有是:

    1. 用户访问网页,DNS服务器(域名解析系统)会根据用户提供的域名查找对应的IP地址,找到后,系统会向对应IP地址的网络服务器发送一个http请求。
    2. 网络服务器解析请求,并发送请求给数据库服务器。
    3. 数据库服务器将请求的资源返回给网络服务器,网络服务器解析数据,并生成html文件,放入http response中,返回给浏览器。
    4. 浏览器解析 http response。
      1~4步骤需要了解HTTP协议。
      访问服务器端可能遭遇的问题:如果网络服务器无法获取数据库服务器返回的资源文件(http response 404),或者由于并发原因暂时无法处理用户的http请求(http response 500)
    5. 浏览器解析 http response后,需要下载html文件,以及html文件内包含的外部引用文件,及文件内涉及的图片或者多媒体文件。

关于加载顺序:当浏览器获得一个html文件时,会”自上而下“加载,并在加载过程中进行解析渲染。

加载:

即为获取资源文件的过程,不同浏览器,以及他们的不同版本在实现这一过程时,会有不同的实现效果(资源间互相阻塞)(需要学习使用timeline来做测试)

<!DOCTYPE html>
<html>
     <head>
           <meta charset="utf-8">
           <link rel="stylesheet"  href="test.css"  type="text/css" />
           <script src="test.js" type="text/javascript"></script>
     </head>
     <body>    
           <p>阻塞</p>
           <img src="test.jpg" /> 
     </body>
</html>

加载过程中遇到外部css文件,浏览器另外发出一个请求,来获取css文件。
遇到图片资源,浏览器会另外发出一个请求,来获取图片资源。这是异步请求,并不会影响html文档进行加载。

但是当文档加载过程中遇到js文件,html文档会挂起渲染(加载解析渲染同步)的线程,不仅要等待文档中js文件加载完毕,还要等待解析执行完毕,才可以恢复html文档的渲染线程。

      原因:js有可能会修改DOM,最为经典的document.write,这意味着,在JS执行完成前,后续所有资源的下载可能是没有必要的,这是js阻塞后续资源下载的根本原因。
      方法:可以将外部引用的js文件放在</body>前。

虽然css文件的加载不影响js文件的加载,但是却影响js文件的执行,即使js文件内只有一行代码,也会造成阻塞。

     原因:可能会有 var width = $('#id').width(),这意味着,js代码执行前,浏览器必须保证css文件已下载和解析完成。这也是css阻塞后续js的根本原因。
     方法:当js文件不需要依赖css文件时,可以将js文件放在头部css的前面。

 

除了<link href="" />,内部<style></style> 这种定义,在考虑阻塞时也要考虑。

不要在外部调用的js文件中调用运行时间较长的函数,如果一定要用,可以使用setTimeout函数。

   因为:1.浏览器GUI渲染线程。

           2.Javascript引擎线程

           3.浏览器定时器触发线程(setTimeout)

           4.浏览器事件触发线程

           5.浏览器http异步请求线程

            浏览器有以上五个常驻线程,注意:这里也涉及到阻塞的现象,当js引擎线程(第二个)进行时,会挂起其他一切线程,这个时候3、4、5这三类线线程也会产生不同的异步事件(这句话不懂啊),由于 javascript引擎线程为单线程,所以代码都是先压到队列,采用先进先出的方式运行,事件处理函数,timer函数也会压在队列中,不断的从队头取出事件,这就叫:javascript-event-loop。

 

解析

html文档解析生成解析树,即dom树,是有dom元素及属性节点组成,树的根是document对象。

    DOM:文档对象模型的缩写,是html文档的对象表示,作为html的外部接口供js调用。

    document.getElementById('test').style.display="none";//通过dom接口将id为test的display值设为none。

css解析将css文件解析为样式表对象。该对象包含css规则,该规则包含选择器和声明对象。

          

渲染:

当浏览器获得一个html文件时,会“自上而下”加载,并在加载过程中进行解析渲染。 
解析: 
       1. 浏览器会将HTML解析成一个DOM树,DOM 树的构建过程是一个深度遍历过程:当前节点的所有子节点都构建好后才会去构建当前节点的下一个兄弟节点。 
       2. 将CSS解析成 CSS Rule Tree 。 
       3. 根据DOM树和CSSOM来构造 Rendering Tree。注意:Rendering Tree 渲染树并不等同于 DOM 树,因为一些像 Header 或 display:none 的东西就没必要放在渲染  树中了。

     

        4.有了Render Tree,浏览器已经能知道网页中有哪些节点、各个节点的css定义以及他们的从属关系。下一步操作称之为Layout,计算出每个节点在屏幕中的位置,

        5.绘制,即遍历render树,并使用UI后端绘制每个节点。

   上述过程是逐渐完成的,为了更好的用户体验,渲染引擎将会尽可能早的将内容呈现在屏幕上,并不会等到所有的html都解析完成之后再去构建和布局render树。它是解析完一部分内容就显示一部分内容,同时,可能通过网络下载其余内容。

几个概念:

(1)Reflow(回流):浏览器要花时间去渲染,当它发现某个部分发生了变化影响,那就需要倒回去重新渲染。

(2)Repaint(重绘):如果知识改变了某个元素的背景颜色,文字颜色等,不影响元素周围或内部布局的属性,将只会引起浏览器的repaint,重画某一部分

 Reflow要比Repaint更花费时间,也就更影响性能。在写代码的时候尽量避免过多的Reflow。

 reflow的原因:

  (1)页面初始化的时候; 
  (2)操作DOM时; 
  (3)某些元素的尺寸变了; 
  (4)如果 CSS 的属性发生变化了。

 减少 reflow/repaint

 (1)不要一条一条地修改 DOM 的样式。与其这样,还不如预先定义好 css 的 class,然后修改 DOM 的 className。 
 (2)不要把 DOM 结点的属性值放在一个循环里当成循环里的变量。 
 (3)为动画的 HTML 元件使用 fixed 或 absoult 的 position,那么修改他们的 CSS 是不会 reflow 的。 
 (4)千万不要使用 table 布局。因为可能很小的一个小改动会造成整个 table 的重新布局。

html页面加载和解析流程:

      1. 用户输入网址(假设是个html页面,并且是第一次访问),浏览器向服务器发出请求,服务器返回html文件; 
      2. 浏览器开始载入html代码,发现<head>标签内有一个<link>标签引用外部CSS文件; 
      3. 浏览器又发出CSS文件的请求,服务器返回这个CSS文件; 
      4. 浏览器继续载入html中<body>部分的代码,并且CSS文件已经拿到手了,可以开始渲染页面了; 
      5. 浏览器在代码中发现一个<img>标签引用了一张图片,向服务器发出请求。此时浏览器不会等到图片下载完,而是继续渲染后面的代码; 
      6. 服务器返回图片文件,由于图片占用了一定面积,影响了后面段落的排布,因此浏览器需要回过头来重新渲染这部分代码; 
      7. 浏览器发现了一个包含一行Javascript代码的<script>标签,赶快运行它; 
      8. Javascript脚本执行了这条语句,它命令浏览器隐藏掉代码中的某个<div> (style.display=”none”)。突然少了这么一个元素,浏览器不得不重新渲染这部分代码; 
      9. 终于等到了</html>的到来,浏览器泪流满面…… 
      10. 等等,还没完,用户点了一下界面中的“换肤”按钮,Javascript让浏览器换了一下<link>标签的CSS路径; 
      11. 浏览器召集了在座的各位<div><span><ul><li>们,“大伙儿收拾收拾行李,咱得重新来过……”,浏览器向服务器请求了新的CSS文件,重新渲染页面。

 

关于script标签的位置:

<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
    <title>测试js代码位置</title>
    <script type="text/javascript">
        var item = document.getElementById("item");
        cosole.log(item);
    </script>

</head>
<body>
    <div id="item" width="100px" height="100px">
        你好
    </div>

</body>
</html>

上述代码中有一段js代码,要在控制台打印一个元素,我把script标签放在head里,控制台里打印出来的是null。 

又把js代码放在body结束标签之前,打印出来的就是div元素了:

这个简单的例子我们可以看到,js代码在加载完后,是立即执行的。 

 

我又做了一个测试,在js代码里面写了一个死循环,把它放在head标签中

<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
    <title>测试js代码位置</title>
    <script type="text/javascript">
        var item = document.getElementById("item");
        while(true){
            console.log(1);
        }
    </script>   
</head>
<body>
    <div id="item" width="100px" height="100px">
        你好
    </div>  
</body>
</html>

一直在执行那个打印1的死循环,后面的body都没有加载渲染出来。所以,这个小例子,我们可以看出,js的下载和执行会阻塞Dom树的构建。

 

 

 Javascript的加载和执行的特点: 
(1)载入后马上执行; 
(2)执行时会阻塞页面后续的内容(包括页面的渲染、其它资源的下载)。原因:因为浏览器需要一个稳定的DOM树结构,而JS中很有可能有 代码直接改变了DOM树结构,比如使用 document.write 或 appendChild,甚至是直接使用的location.href进行跳转,浏览器为了防止出现JS修 改DOM树,需要重新构建DOM树的情况,所以 就会阻塞其他的下载和呈现。

   

减少 JavaScript 对性能的影响的方法:

    1. 将所有的script标签放到页面底部,也就是body闭合标签之前,这能确保在脚本执行前页面已经完成了DOM树渲染。
    2. 尽可能地合并脚本。页面中的script标签越少,加载也就越快,响应也越迅速。无论是外链脚本还是内嵌脚本都是如此。
    3. 采用无阻塞下载 JavaScript 脚本的方法: 
      (1)使用script标签的 defer 属性(仅适用于 IE 和 Firefox 3.5 以上版本); 
      (2)使用动态创建的script元素来下载并执行代码;

 

推荐阅读