# 输入URL背后的技术步骤

一道经典的面试题,涵盖的知识点非常多,这里解答下该问题,以对自己的知识体系进行梳理。

  1. 系统层
    1. 发起http请求,解析域名
    2. DNS
      1. Chrome搜索自身DNS缓存。chrome输入chrome://net-internals/#dns可查看到
      2. 搜索操作系统自身DNS缓存
      3. 读取本地HOST文件
      4. 以上都查询不到时,浏览器发送一个DNS的系统调用,DNS请求到达宽带运营商服务器。
      5. 宽带运营商服务器查询自身缓存
      6. 没查询时,发起一个迭代(顶级域--次级域名--...)的DNS解析请求,直到获取到域名对应的IP地址。
    3. 拿到域名对应的IP并缓存
      1. 宽带运营商服务器缓存DNS
      2. 结果返回操作系统并缓存DNS
      3. 结果返回浏览器并缓存DNS
    4. 得到目标IP,发起Http“三次握手”,建立起TCP/IP连接
      1. 客户端发送一个带有SYN标志的数据包给服务端
      2. 服务端回传一个带有SYN/ACK标志的数据包
      3. 客户端再回传一个带ACK标志的数据包给服务端
    5. 连接成功后,浏览器向服务器发起标准Http请求
      1. 构建Http请求报文
        • 请求行。
          • 格式:Method Request-URL HTTP-Version CRLF,如:GET index.html HTTP/1.1
          • Method可选项:GET, POST, PUT, DELETE, OPTIONS, HEAD
        • 请求报头
          • 允许客户端向服务器传递请求的附加信息
          • 常见请求报头:Content-Type, Cache-Control,CookieAccept-Encoding,Accept-Language,等
        • 请求正文
          • 当使用POST, PUT等方法时,通常需要客户端向服务器传递数据。
      2. 通过TCP协议,发送到服务器指定端口(Http协议默认80端口、Https协议默认443)
    6. 服务器收到请求后,经过后端处理返回结果。(前后端分离)
      • 响应报文
        • 状态码
          • 1xx:指示信息–表示请求已接收,继续处理。
          • 2xx:成功–表示请求已被成功接收、理解、接受。
          • 3xx:重定向–要完成请求必须进行更进一步的操作。
          • 4xx:客户端错误–请求有语法错误或请求无法实现。
          • 5xx:服务器端错误–服务器未能实现合法的请求。
        • 响应报头
        • 响应报文
    7. 返回Html页面等资源,html包含css/js等资源,重复以上http请求
  2. 渲染层
    1. Chrome浏览器的渲染引擎 Blink(常说的浏览器内核)边接收边解析 HTML 内容,浏览器自上而下逐行解析 HTML 内容,经过词法分析、语法分析,构建 DOM 树。HTML文档被加载和解析完成时(DOM树构建完成),触发DOMContentLoaded事件,此时页面可以渲染展示出内容了。(html引用的图片可能还在http请求加载,当所有资源全部请求完成,触发load事件)
      • 当遇到外部 CSS 链接时,不阻塞而继续构建 DOM 树。
      • 当遇到外部 JS 链接时,异步获取资源。JS下载后,V8引擎(常说的JavaScript引擎)会解析、编译JS内容。由于 JS 可能会修改 DOM 树和 CSSOM 树而造成回流和重绘,故JS会阻塞DOM树的构建。
    2. 下载CSS后,主线程会在合适时机解析CSS内容,构建 CSSOM 树。本来构建DOM树和CSSOM树是并行的,互不影响,但当解析到上文提到的JavaScript时,需要构建完成CSSOM树后,才能执行js代码(DOM树此时被挂起),因为js可以查询/修改任意对象的样式,此时需要CSSOM树构建完成。
    3. 浏览器结合 DOM 树和 CSSOM 树构建 Render 树。Render树与DOM树不同,渲染树中并没有head、display为none等不必显示的节点。
    4. 浏览器渲染(布局 + 绘制 + 复合图层化),布局(Layout)环节主要负责各元素尺寸、位置的计算,绘制(Paint)环节则是绘制页面像素信息,合成(Composite)环节是多个复合层的合成,最终合成的页面被用户看到。
      1. 回流:DOM节点中的各个元素都是以盒模型的形式存在,这些都需要浏览器去计算其位置和大小等
      2. 重绘:当盒模型的位置,大小以及其他属性,如颜色,字体,等确定下来之后,浏览器便开始绘制内容

image

html内容从上到下解析,浏览器遇到body标签开始显示内容。CSS 不会阻塞 DOM 的解析,JS 会阻止DOM的解析。

当文档加载过程中遇到JS文件,HTML文档会挂起渲染过程,不仅要等到文档中JS文件加载完毕还要等待解析执行完毕,才会继续HTML的渲染过程。

现代浏览器都使用了预加载器,在js挂起DOM解析时,会继续解析后面的html,寻找需要下载的资源。预加载器下载这些资源,以减少JS阻塞带来的影响。

# 优化

了解以上,我们就能知道以下这些前端优化点:

  • http请求数减少,如:雪碧图、合并CSS/JS文件、缓存资源等(针对http1.1)
  • http请求资源体积减少,如:启用gzip压缩、图片压缩、减少cookie、按需加载等
  • css放在head中。由于同时具有 DOM 和 CSSOM 才能构建渲染树,所以HTML 和 CSS 都是阻塞渲染的资源,所以尽量精简CSS也是优化方式之一。
  • js放在body底部,减少白屏时间。因为js会阻止浏览器解析。
  • 减少回流和重绘制,比如不要一条一条修改DOM样式、使用documentFragment操作DOM等。

# 衍生问题

  1. 响应报文304作用以及缓存相关
  2. js事件循环(event loop)

# 参考文章