且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

HTTP协议压缩格式和URL编码介绍

更新时间:2022-08-17 20:07:07

HTTP压缩是指web服务器和浏览器之间压缩传输请求响应结果的方法,通过采用通用的压缩算法,将数据包压缩后进行传输,从而提升页面加载速度,给用户一个更好的体验。

1

HTTP压缩过程


数据包压缩的过程,其实就是客户端发请求的时候先告诉服务器,我能支持某种算法的压缩,服务端获取到这个参数后,按照特定的格式将原有的响应结果压缩后返回客户端,客户端再进行解码。大致有几下几个步骤:

1、客户端发请求给服务端,在请求中的Header中,在Accept-Encoding中告诉服务端自己支持那种格式压缩

2、服务端收到请求后,得到原始响应结果,通过压缩算法(比如gzip)对响应结果进行编码,然后在响应Header中加入Content-Encoding:gzip,把结果返回给客户端

3、客户端接收到响应结果后,根据Content-Encoding的内容对结果进行解码,获得解压后的内容,然后呈现在页面。




2

HTTP内容编码类型介绍


HTTP定义了一些表中的内容编码类型,主要有以下几种:

  • gzip:表明实体采用GNU zip编码
  • compress:表明实体采用UNIX的文件压缩程序
  • deflate:表明实体是用zlib的格式压缩的
  • identify:表明没有对实体进行编码,Header中默认选项就是identify


gzip是如何压缩的?

简单来说,gzip就是在一个文本文件中找出类似的字符串,然后临时替换他们,从而使整个文件变小,比较适合压缩hrml、css、js等文件,对图片类的压缩效果不明显。

gzip在工作中运用的还是挺多的,比如手机***问的H5轻应用报表,如果采用在线的方式加载的话,每次点击的时候都要去请求相关的js之类的,弱网的时候容易白屏,这个时候就可以把相关需要的js资源文件用gzip压缩打包,采用离线加载的方式进行页面加载,同时也提升了用户体验,避免了一些由于网络不稳定带来的体验性问题。



3

URL Encode介绍


相信大家平常在访问网页的时候,url地址栏中的地址总会出现一些类似“%20”之类的字符,这其实就是url地址被编码显示了。url地址只能用字母、数字和某些标点符号组成,不能使用中文等。Url Encoding就是把所有的非字母、数字符号的都替换成对应的编码。


使用python脚本对某个字符串进行url编码解码:

import urllib
str='%E4%BD%A0%E5%A5%BD'
print(urllib.unquote(str))  #你好
print(urllib.quote("你好")) #%E4%BD%A0%E5%A5%BD

HTTP协议压缩格式和URL编码介绍


使用fiddler工具栏Tools下的TextWizard小工具进行字符串编码转换:


HTTP协议压缩格式和URL编码介绍