第5章 》模拟网络请求

Posted liukang92

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第5章 》模拟网络请求相关的知识,希望对你有一定的参考价值。

  python发送网络请求是通过模块中的方法来实现的,模块定义好了请求的语法格式,只需要按照相应的语法格式对号入座写代码即可。

一般来说我们测试的都是基于HTTP和HTTPS的网络请求,python有很多自动带的原生模块和扩展模块均可以模拟网络请求。当然我们在实际工作中会遇到很多其他协议请求,如WebSocket等。

  本章以HTTP协议为例,采用原生模块和扩展模块对比的方式,给大家剖析一下原理。原理性的东西虽然广泛不被重视,但它对大家之后的学习是十分有好处的。

5.1 发送HTTP请求

5.1.1  requests模块

  python有很多模块都可以发送HTTP请求,包括原生的模块http.client,urlib2等,第三方模块requests等,都封装了发送HTTP请求的方法。由于原生的模块过于复杂,不推荐使用,之后所有的请求都是基于第三方模块requests进行的,该模块的好处在于简单,把请求的框架都搭建好了,只需要填入相应的参数数据,就能发送网络请求了。

  requests模块非原生模块,所有要使用还需要先进行安装,按照之前安装模块的方法,打开命令行(在运行中输入cmd),然后在命令行输入:

  pip install requests

  接前就会自动安装requests模块及其相关模块,然后就可以引入该模块使用其提供的方法了。

  import requests

  后面会通过一些实例来介绍requests的具体使用方法。

 

5.1.2  请求与响应

  HTTP就是发送请求和获取响应的一个过程,而requests模块只需要一步就能完成这样的一个过程,并且request支持所有的HTTP请求的方法和响应数据,先进行语法介绍:

  r = requests.方法(url, headers, data, ...)

  其中url参数为必填的,毕竟HTTP请求就是对指定的URL进行发送,其他各种参数可根据实际请求的需要选择性使用。

  发送请求后会获取响应结果,然后把结果赋值给变量,最后通过变量的属性值取出需要的结果,下面就是常用返回结果:

  r.headers  获取返回的头信息

  r.text    获取返回的主体(其实就是网页html

  r.cookies  获取返回的cookies

  r.status_code  获取返回的状态码(通常会通过状态码判断请求是否成功)

  学会requests的请求方法和获取响应的结果,就可以开始网络请求的测试了,下面就通过代码实例来熟悉requests的模块吧。

 

5.1.3  请求参数

1.URL参数

  URL是唯一的必填参数,既然是网络请求,必须要有URL地址才能发送,就像快递一定要写目的地才能发件一样。先从最简单的HTTP请求讲起,请求一个静态页面,比如访问网易首页,通过抓包可以看到该请求是用的get方式发送的,所有要调用requests的get()方法来发送请求。

  以网易首页作为请求例子,实例代码:

  import requests  # 导入requests模块;

  test_url = "http://www.163.com"  # 定义url

  response = requests.get(test_rul)  # 实例化requests.get()方法

  print(response.status_code)  # 输出返回的状态码

  print(response.headers)  # 输出返回的头信息

  print(response.text)  # 输出返回的主体

  技术分享图片

  代码说明:

    1 导入requests模块;

    2 将网易首页的URL赋值到变量test_url中(这样的好处在于看起来清晰,也方便代码今后的维护);

    3 在get()方法中将变量test_url直接传入,即完成了带URL的get请求(结果会赋值到变量reponse中,reponse中包含了返回结果的所有数据,可以根据需要获取想要的数据);

    4、5、6 获取并打印返回的结果(状态码、头信息、主体)

  运行结果如下图: 技术分享图片

  可以看出通过requests发送的HTTP请求只有3行代码,就那么简单的一行代码完成整个请求。

  整个请求过程全被封装在方法之中,对于没有编码基础的测试人员来说再适合不过了。

 

2、headers  参数

  headers是最常用的参数之一,前面那个例子只是最简单的请求,没有带其他参数信息,而很多时候需要带入headers发送请求,才可以获取相应的请求结果。

还是以网易首页作为例子,如果是pc端的请求,会返回pc端的页,如果是手机端的请求,则返回手机端的页面,这时候就要带上headers参数的请求,通过浏览器的抓包工具可以看到headers有个字段“User-Agent",而服务器就是根据这个字段来判断访问的来源,如果需要模拟手机端请求,需要将“User-Agent"改为请求的手机型号。

  实例代码:

  import requests
  test_url = "http://www.163.com"
  h = {"User-Agent":"android/H60-L01/4.4.2"}  # 将headers赋值到变量h中;
  reponse = requests.get(test_url, headers=h)  # 在get()方法中加一个headers参数,然后将变量赋值给headers参数。
  print(reponse.status_code)
  print(reponse.headers)
  print(reponse.text)

   技术分享图片

  运行结果如下:  技术分享图片

 

3、cookies  参数

  cookies也是最常用的参数之一,因为只要涉及登录后数据获取,都需要用到cookies参数,那么如何获取到cookies呢,一种是通过post发送登录请求,获取返回值的cookies属性(这个会在后面的实例中讲解),还有一种就是通过浏览器的网络抓包方式获取,在还不会熟练使用request模块的前提下,就先介绍如何通过抓包获取cookies。

  首先打开chrome浏览器,然后登录网易邮箱(或其它网站),接着按F12(或在网页右键,选择检查)打开开发者工具,抓取cookies的界面如下图:

技术分享图片

  选择application中的cookies,点击对应的测试URL域名,再找到session属性并且domain是对应测试请求的域名,然后这条信息name和value对应的就是cookies了。

  cookies参数以字典的形式发送,只需要对应的将name和value传入即可。

  实例代码:

  import requests
  c = {"JSESSIONID":"abcRPAFmBY_sqf2qRMmxw"}
  test_url = "https://www.163.com/"
  reponse = requests.get(test_url, cookies=c)
  print(reponse.status_code)
  print(reponse.headers)
  print(reponse.text)

  代码说明:

    2 将浏览器抓取的cookies信息以字典的形式赋值到变量c之中;

    4 在get方法中加一个cookies参数,然后将变量c赋值给cookies参数,即完成了带着cookies信息的get请求。

  其实cookies也是可以通过headers参数传递的,只是不同之处在于cookies是以字典的形式发送的,而在headers之中cookies只是其中一个键,所以需要把cookies放到该键对应的值里面,而对应的值是以key=value的形式传入的,改一下代码。

  import requests
  c = {"JSESSIONID":"abcRPAFmBY_sqf2qRMmxw"}
  test_url = "https://www.163.com/"
  reponse = requests.get(test_url, headers={"cookies":c})  # 此处cookies是作为headers的键值传入;
  print(reponse.status_code)
  print(reponse.headers)
  print(reponse.text)

  代码说明:

    4 在get方法中将变量c赋值给headers参数中的cookies字段,即完成了带着cookies信息的get请求。

  以上的两种方法,推荐使用cookies参数,一方面把cookies单独分离出来,不用与其他headers的字段放在一起,让代码更清晰,另一方面通过post请求返回的cookies是可以直接赋值到cookies参数之中,不需要再做转换。

 

4、params 参数

  对于params参数可以存放请求的表单,并会以key1=value1&key2=value2&key3=value3的形式跟进URL之后发送,为了区分URL和参数,最好不要把表单放在URL之中,可以通过params参数进行发送, 上面网易邮箱的URL也是带着参数的,直接放在URL之中,如果使用params参数就可以把后面的参数和URL分离。

  还是以博客园登录界面为例,只是URL部分把参数进行分离,代码如下:

  import requests
  # test_url = "https://passport.cnblogs.com/user/signin?ReturnUrl=https%3A%2F%2Fwww.cnblogs.com%2F"
  test_url = "https://passport.cnblogs.com/user/signin"
  p = {"ReturnUrl":"https%3A%2F%2Fwww.cnblogs.com%2F"}
  reponse = requests.get(test_url, params=p)
  print(reponse.status_code)
  print(reponse.headers)
  print(reponse.text)

  代码说明:

  4 将需要发送表单以字典的形式赋值到变量p之中。

  5 在get方法中加一个params的参数,然后将变量p赋值给params参数,即完成了带着params信息的get请求。

  如果不使用params参数,也可以直接把表单加在URL中,只是代码不清晰,所以不推荐直接把表单加在URL中。

 

5、data 参数

  data参数也是用于存放请求表单,是request模块中最重要的参数之一。

  在使用data之前,先来了解一下post提交数据类型,区别与params,params只有一种类型(字符串类型),而post可以提交4种类型的数据,至于需要提交什么类型的数据,取决于服务器接收的数据类型。post的数据类型需要和服务器接收的一致,不然服务器就无法正常识别post的数据,导致测试结果报错。就像协议一样,接收方预定接收哪种类型的表单,然后发头方按照接收方指定的协议发送表单,这样就完成了一个表单的提交。

  如何识别服务器接收的数据类型?最简单的方式还是抓包。抓取数据类型的界面如下:

  技术分享图片

  通过抓包可以看到,在request headers 中有一个content-type的字段,这个字段表示了post发送数据的类型,一般分为以下4种类型:

  第1种:content-type:application/json

    实际上,现在越来越多的人反application/json作为请求头,用来告诉服务器消息主体是序列化后的json字符串。由于json规范流行,除了低版本IE之外的各大浏览器都原生支持json.stringify,服务器端语言也都有处理json的函数,并且json格式支持比键值对更加复杂的结果化数据。

    

  第2种:content-type:application/x-www-form-urlencoded

    这是最常见的post提交数据的方式,浏览器的原生form表单,如果不设置enctype属性,那么最终就会以application/x-www-form-urlencoded方式提交数据。提交的数据按照key1=value1&key2=value2的方式进行编码,key和value都进行了URL转码,然后打包发送到服务器。

 

  第3种:content-type:multipart/form-data

    content-type为multipart/form-data方式,主要用于上传文件。需要注意的是同时form的enctype属性也要设置为multipart/form-data,才能正确提交并解析所传输的数据。

 

  第4种:content-type:text/xml

     它是一种使用http作为传输协议,XML作为编码方式的远程调用规范。考虑到XML结构还是过于臃肿,一般场景用json会更灵活方便,所以这种提交我们的工作中实际使用的不多,仅了解一下就可以了。

 

  最常见的是 第2种 类型,直接将数据以{key:value}的字典形式赋值给表单,然后通过request.post()中的data参数传递就可以了。

  以网易音乐为例,搜索一首歌曲,通过抓包可以看到content-type是application/x-www-form-urlencoded,网易音乐的数据类型抓取图如下:

  技术分享图片

  

  搜索一首”一次就好“,通过抓包会发现有进行加密,那就直接把加密后的内容放到form之中发送出去,网易音乐的表单抓取如下图:

 

  技术分享图片

 

  实例代码:

  import requests
  test_url = "https://music.163.com/weapi/search/suggest/web?csrf_token="
  f = {"params":"ShQVLipkE8Y/p89iMoKOX5whEin1ZyoKeXZJJe+rBg+8mrEQT3RaAR5UP5B+ayoKrPIVzxsVuuFA1askCPcBzRJ6qOoPsPz06xStotZZGTmHrzaz1RcbiRpYOOrZl8NC",
   "encSecKey":"9ac26cbd1a87fd9790fb1cc2f0a475a5cd24be6b73e1b516f86b00ab58b568c0d4303eb6314bbedf5adedb968f047f44bb6ebe1fd9cfa09339a781d762e8aba0184c8a57dc53d1717f89d5c85d02e635cec9e7610fac4faac33838a3f299a1aa672390e4430b21ee2ea03e37aee53d17d70973933ffdf3fc7872101a9ff973da"
  }
  reponse = requests.post(test_url, data=f)
  print(reponse.status_code)
  print(reponse.headers)
  print(reponse.text)

   代码说明:

    3 将需要发送的表单以字典形式赋值到变量form之中。

    4 在post方法中加一个data参数,然后将变量赋值给data参数,即完成了带着表单信息的post请求。

  运行结果如下图:

    技术分享图片

 

以上内容来自《python测试之道》——杨燕林、朱对洲、石赟 编著,若有侵权请联系删除。


































以上是关于第5章 》模拟网络请求的主要内容,如果未能解决你的问题,请参考以下文章

开啃《机器学习》(周志华)- 第5章 神经网络

《TCP/IP详解卷1:协议》第5章 RARP:逆地址解析协议---读书笔记

Unity Shader入门精要学习笔记 - 第5章 开始 Unity Shader 学习之旅

第2章 GNS3和PacketTracer网络模拟器_GNS3概述

VSCode自定义代码片段14——Vue的axios网络请求封装

VSCode自定义代码片段14——Vue的axios网络请求封装