抓包视频教程

Posted 2023-05-06

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了抓包视频教程相关的知识，希望对你有一定的参考价值。

参考技术A

1、打开wireshark 2.6.5，主界面如下：

2、选择菜单栏上Capture -> Option，勾选WLAN网卡（这里需要根据各自电脑网卡使用情况选择，简单的办法可以看使用的IP对应的网卡）。点击Start。启动抓包。

3、wireshark启动后，wireshark处于抓包状态中。

4、执行需要抓包的操作，如在cmd窗口下执行ping www.baidu.com。

5、操作完成后相关数据包就抓取到了。为避免其他无用的数据包影响分析，可以通过在过滤栏设置过滤条件进行数据包列表过滤，获取结果如下。说明：ip.addr == 119.75.217.26 and icmp 表示只显示ICPM协议且源主机IP或者目的主机IP为119.75.217.26的数据包。说明：协议名称icmp要小写。

5、wireshark抓包完成，就这么简单。关于wireshark显示过滤条件、抓包过滤条件、以及如何查看数据包中的详细内容在后面介绍。

Wireshakr抓包界面介绍

说明：数据包列表区中不同的协议使用了不同的颜色区分。协议颜色标识定位在菜单栏View --> Coloring Rules。如下所示

WireShark 主要分为这几个界面

1. Display Filter(显示过滤器)，用于设置过滤条件进行数据包列表过滤。菜单路径：Analyze --> Display Filters。

2. Packet List Pane(数据包列表)，显示捕获到的数据包，每个数据包包含编号，时间戳，源地址，目标地址，协议，长度，以及数据包信息。不同协议的数据包使用了不同的颜色区分显示。

3. Packet Details Pane(数据包详细信息), 在数据包列表中选择指定数据包，在数据包详细信息中会显示数据包的所有详细信息内容。数据包详细信息面板是最重要的，用来查看协议中的每一个字段。各行信息分别为

（1）Frame: 物理层的数据帧概况

（2）Ethernet II: 数据链路层以太网帧头部信息

（3）Internet Protocol Version 4: 互联网层IP包头部信息

（4）Transmission Control Protocol: 传输层T的数据段头部信息，此处是TCP

（5）Hypertext Transfer Protocol: 应用层的信息，此处是HTTP协议

TCP包的具体内容

从下图可以看到wireshark捕获到的TCP包中的每个字段。

4. Dissector Pane(数据包字节区)。

Wireshark过滤器设置

初学者使用wireshark时，将会得到大量的冗余数据包列表，以至于很难找到自己需要抓取的数据包部分。wireshark工具中自带了两种类型的过滤器，学会使用这两种过滤器会帮助我们在大量的数据中迅速找到我们需要的信息。

（1）抓包过滤器

捕获过滤器的菜单栏路径为Capture --> Capture Filters。用于在抓取数据包前设置。

如何使用？可以在抓取数据包前设置如下。

ip host 60.207.246.216 and icmp表示只捕获主机IP为60.207.246.216的ICMP数据包。获取结果如下：

（2）显示过滤器

显示过滤器是用于在抓取数据包后设置过滤条件进行过滤数据包。通常是在抓取数据包时设置条件相对宽泛或者没有设置导致抓取的数据包内容较多时使用显示过滤器设置条件过滤以方便分析。同样上述场景，在捕获时未设置抓包过滤规则直接通过网卡进行抓取所有数据包，如下

执行ping www.huawei.com获取的数据包列表如下

观察上述获取的数据包列表，含有大量的无效数据。这时可以通过设置显示器过滤条件进行提取分析信息。ip.addr == 211.162.2.183 and icmp。并进行过滤。

上述介绍了抓包过滤器和显示过滤器的基本使用方法。在组网不复杂或者流量不大情况下，使用显示器过滤器进行抓包后处理就可以满足我们使用。下面介绍一下两者间的语法以及它们的区别。

wireshark过滤器表达式的规则

1、抓包过滤器语法和实例

抓包过滤器类型Type（host、net、port）、方向Dir（src、dst）、协议Proto（ether、ip、tcp、udp、http、icmp、ftp等）、逻辑运算符（&& 与、|| 或、！非）

（1）协议过滤

比较简单，直接在抓包过滤框中直接输入协议名即可。

tcp，只显示TCP协议的数据包列表

http，只查看HTTP协议的数据包列表

icmp，只显示ICMP协议的数据包列表

（2）IP过滤

host 192.168.1.104

src host 192.168.1.104

dst host 192.168.1.104

（3）端口过滤

port 80

src port 80

dst port 80

（4）逻辑运算符&& 与、|| 或、！非

src host 192.168.1.104 && dst port 80 抓取主机地址为192.168.1.80、目的端口为80的数据包 host 192.168.1.104 || host 192.168.1.102 抓取主机为192.168.1.104或者192.168.1.102的数据包

！broadcast 不抓取广播数据包

2、显示过滤器语法和实例

（1）比较操作符

比较操作符有== 等于、！= 不等于、> 大于、< 小于、>= 大于等于、<=小于等于。

（2）协议过滤

比较简单，直接在Filter框中直接输入协议名即可。注意：协议名称需要输入小写。

tcp，只显示TCP协议的数据包列表

http，只查看HTTP协议的数据包列表

icmp，只显示ICMP协议的数据包列表

（3） ip过滤

ip.src ==192.168.1.104 显示源地址为192.168.1.104的数据包列表

ip.dst==192.168.1.104, 显示目标地址为192.168.1.104的数据包列表

ip.addr == 192.168.1.104 显示源IP地址或目标IP地址为192.168.1.104的数据包列表

（4）端口过滤

tcp.port ==80, 显示源主机或者目的主机端口为80的数据包列表。

tcp.srcport == 80, 只显示TCP协议的源主机端口为80的数据包列表。

tcp.dstport == 80，只显示TCP协议的目的主机端口为80的数据包列表。

（5） Http模式过滤

http.request.method=="GET", 只显示HTTP GET方法的。

（6）逻辑运算符为 and/or/not

过滤多个条件组合时，使用and/or。比如获取IP地址为192.168.1.104的ICMP数据包表达式为ip.addr == 192.168.1.104 and icmp

（7）按照数据包内容过滤。假设我要以IMCP层中的内容进行过滤，可以单击选中界面中的码流，在下方进行选中数据。如下

右键单击选中后出现如下界面

选中Select后在过滤器中显示如下

后面条件表达式就需要自己填写。如下我想过滤出data数据包中包含"abcd"内容的数据流。包含的关键词是contains 后面跟上内容。

看到这，基本上对wireshak有了初步了解

爬虫之Fiddler抓包腾讯视频

福利干货，第一时间送达！

@图片自制by小si

本文作者

王豪：行路难，多歧路，今安在，埋头苦改bug会有时，直到bug改完才吃饭。

阅读文本大概需要 9 分钟。

一、抓包分析

1.下载工具并安装

2.Fiddler工具的使用

二、爬取腾讯视频某视频所有评论

1.思路分析

2.具体代码

3.结果展示

一、抓包分析

1.下载工具并安装

如果我们要进行抓包分析，首先，我们必须要有一款抓包的工具，只有用工具抓到包，我们才能进行分析，在这里我介绍一款抓包软件Fiddler，我这里有这个软件的分享：
链接：https://pan.baidu.com/s/1JvJvH7wfRLzALluOrOlcvQ
提取码：9099
安装不需要过多的说，按照上面提示的步骤装就可以了。

2.Fiddler工具的使用

（1）首先， Fiddler 工具分为四块：显示所抓的包、请求区、响应区和语句输入区

（2）有的js包需要手动点击一下，才能解析出来：

（3）一般，我们抓包分析都是点击响应区中的TextView，再观察。

二、爬取腾讯视频某视频所有评论

1.思路分析

这里我想爬取斗罗大陆的所有评论。
（1）进入到斗罗大陆动画片的评论区：

（2）打开 Fiddler ，然后，刷新页面，找到存放评论信息的js包：

（3）因为评论是手动点击加载更多触发的，所有，我们多加载几个：

（4）观察网址结构，得出结论：

（5）下一个提取id我发现每次都可以在上一个js包中找到，这些js包像一个链表一样，是链式链接的。下面的图片是我在第一个js包中搜索第二个js包的id的例子：

这样，我们就能找到所有的js包，从而爬取所有的评论。

2.具体代码

 
   
   
 
  
    
    
  #提取10次，每次提取10个
  
    
    
  

  
    
    
  import urllib.request,time
  
    
    
  

  
    
    
  import urllib.error
  
    
    
  

  
    
    
  import random,re
  
    
    
  

  
    
    
  

  
    
    
  

  
    
    
  '''
作用：该模块为爬虫设置用户和ip代理
参数：thisUrl是要爬取的网址
    ip_pool是ip代理池
返回值：返回爬取网页信息的二进制数据
'''
  
    
    
  

  
    
    
  def ua_ip(thisUrl, ip_pool):
  
    
    
  

  
    
    
      #构建用户代理池
  
    
    
  
  
    
    
  

  
    
    
      ua_pool = [
  
    
    
  

  
    
    
          'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5558.400 QQBrowser/10.1.1695.400',
  
    
    
  

  
    
    
          'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)',
  
    
    
  

  
    
    
          'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16',
  
    
    
  

  
    
    
          'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36',
  
    
    
  

  
    
    
          'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)',
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Acoo Browser; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0; AOL 9.5; AOLBuild 4337.35; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.04506.30)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/523.15 (KHTML, like Gecko, Safari/419.3) Arora/0.3 (Change: 287 c9dfb30)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (X11; U; Linux; en-US) AppleWebKit/527+ (KHTML, like Gecko, Safari/419.3) Arora/0.6",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9) Gecko/20080705 Firefox/3.0 Kapiko/3.0",
  
    
    
  

  
    
    
          "Mozilla/5.0 (X11; Linux i686; U;) Gecko/20070322 Kazehakase/0.4.5",
  
    
    
  

  
    
    
          "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.8) Gecko Fedora/1.9.0.8-1.fc10 Kazehakase/0.5.6",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20",
  
    
    
  

  
    
    
          "Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; fr) Presto/2.9.168 Version/11.52",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER",
  
    
    
  

  
    
    
          "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E; LBBROWSER)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 LBBROWSER",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; QQBrowser/7.0.3698.400)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SV1; QQDownload 732; .NET4.0C; .NET4.0E; 360SE)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
  
    
    
  

  
    
    
          "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1",
  
    
    
  

  
    
    
          "Mozilla/5.0 (iPad; U; CPU OS 4_2_1 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8C148 Safari/6533.18.5",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:2.0b13pre) Gecko/20110307 Firefox/4.0b13pre",
  
    
    
  

  
    
    
          "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:16.0) Gecko/20100101 Firefox/16.0",
  
    
    
  

  
    
    
          "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11",
  
    
    
  

  
    
    
          "Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10"
  
    
    
  
  
    
    
  

  
    
    
      ]
  
    
    
  

  
    
    
  

  
    
    
      thisUA = random.choice(ua_pool) #从用户代理池中随机选择一个用户代理
  
    
    
  
  
    
    
  

  
    
    
      thisIP = random.choice(ip_pool) #从ip代理池中随机选择一个ip代理
  
    
    
  
  
    
    
  

  
    
    
      print("用户代理：
  
    
    
  {}"
  
    
    
  .format(thisUA))
  
    
    
  

  
    
    
      print("ip代理：
  
    
    
  {}"
  
    
    
  .format(thisIP))
  
    
    
  

  
    
    
      #将IP代理格式化
  
    
    
  
  
    
    
  

  
    
    
      proxy = urllib.request.ProxyHandler({'http': thisIP})
  
    
    
  

  
    
    
      #安装IP代理,并构建开启工具
  
    
    
  
  
    
    
  

  
    
    
      opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)
  
    
    
  

  
    
    
      #构造报头
  
    
    
  
  
    
    
  

  
    
    
      headers = ('user-agent', thisUA)
  
    
    
  

  
    
    
      #安装报头
  
    
    
  
  
    
    
  

  
    
    
      opener.addheaders = [headers]
  
    
    
  

  
    
    
      #将opener设置为全局
  
    
    
  
  
    
    
  

  
    
    
      urllib.request.install_opener(opener)
  
    
    
  

  
    
    
      #以二进制形式爬取信息
  
    
    
  
  
    
    
  

  
    
    
      respense = urllib.request.urlopen(thisUrl)
  
    
    
  

  
    
    
      data = respense.read()
  
    
    
  

  
    
    
      respense.close()    #避免持续链接导致被发现是爬虫
  
    
    
  
  
    
    
  

  
    
    
      return data
  
    
    
  

  
    
    
  

  
    
    
  def main():
  
    
    
  

  
    
    
      ip_pool = [
  
    
    
  

  
    
    
          '127.0.0.1:8888'
  
    
    
  
  
    
    
  

  
    
    
      ]
  
    
    
  

  
    
    
      v_id = '2369303789'     #要爬取的视频的id，这里我爬取的是斗罗大陆的
  
    
    
  
  
    
    
  

  
    
    
      c_id = '0'    #第一次评论的id
  
    
    
  
  
    
    
  

  
    
    
      num = '10'  #每一页提取的评论数数目
  
    
    
  
  
    
    
  

  
    
    
      n = 1   #用来记录获取的评论总数
  
    
    
  
  
    
    
  

  
    
    
      fp = open('D:\\python\\new.txt', 'a+')
  
    
    
  

  
    
    
      for i in range(0, 10):
  
    
    
  

  
    
    
          try:
  
    
    
  

  
    
    
              # 网址格式：
  
    
    
  http://coral.qq.com/article/【视频id】/comment/v2?callback=_article2369303789commentv2&orinum=【一次提取的评论数目】&oriorder=o&pageflag=1&cursor=【下一个视频id】
  
    
    
  

  
    
    
              url = 'http://coral.qq.com/article/'+ v_id +'/comment/v2?callback=_article2369303789commentv2&orinum='+ num +'&oriorder=o&pageflag=1&cursor='+c_id
  
    
    
  

  
    
    
              #对获取的二进制数进行解码
  
    
    
  
  
    
    
  

  
    
    
              data = ua_ip(url, ip_pool).decode('utf-8', 'ignore')
  
    
    
  

  
    
    
              #构造获取下一页评论ip的正则表达式
  
    
    
  
  
    
    
  

  
    
    
              pat1 = '"last":"(.*?)"'
  
    
    
  
  
    
    
  

  
    
    
              c_ids = re.compile(pat1).findall(data)
  
    
    
  

  
    
    
              c_id = c_ids[0]     #c_ids是一个列表，获取他的第一个元素就是下一页评论id
  
    
    
  
  
    
    
  

  
    
    
              #构造获取评论内容的正则表达式
  
    
    
  
  
    
    
  

  
    
    
              pat2 = '"content":"(.*?)"'
  
    
    
  
  
    
    
  

  
    
    
              comment_list = re.compile(pat2).findall(data)
  
    
    
  

  
    
    
              for comment in comment_list:
  
    
    
  

  
    
    
                  thisdata = "第"+str(n)+"个评论为：
  
    
    
  "
  
    
    
   + eval('u"' + comment + '"')
  
    
    
  

  
    
    
                  print(thisdata)
  
    
    
  

  
    
    
                  fp.write(thisdata + '\n')
  
    
    
  

  
    
    
                  n += 1
  
    
    
  
  
    
    
  

  
    
    
          except urllib.error.HTTPError as e:
  
    
    
  

  
    
    
              if hasattr(e, 'code'):
  
    
    
  

  
    
    
                  print(e.code)
  
    
    
  

  
    
    
              if hasattr(e, 'reason'):
  
    
    
  

  
    
    
                  print(e.reason)
  
    
    
  

  
    
    
          except Exception as err:
  
    
    
  

  
    
    
              print(err)
  
    
    
  

  
    
    
          time.sleep(2)    # 每爬取一页，停顿2秒，减少频率，从而减少被发现的几率
  
    
    
  
  
    
    
  

  
    
    
      fp.close()
  
    
    
  

  
    
    
  

  
    
    
  if __name__ == '__main__':  
  
    
    
  

  
    
    
      main()

3.结果展示

昨天最佳留言读者：随便起个网名吧

以上是关于抓包视频教程的主要内容，如果未能解决你的问题，请参考以下文章

抓包工具Fiddler-使用教程

微信小程序抓包与逆向+微信小程序反编译教程+解包教程+解包工具

Fiddler 抓包教程

Fiddler使用教程

【HttpCanary】Android网络分析工具HttpCanary使用教程

fiddler使用教程是啥？