某易跟帖频道，接口溯源分析，反爬新技巧，必掌握一下

Posted 2022-04-30 梦想橡皮擦

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了某易跟帖频道，接口溯源分析，反爬新技巧，必掌握一下相关的知识，希望对你有一定的参考价值。

📢📢📢📢📢📢
💗 你正在阅读 【梦想橡皮擦】 的博客
👍 阅读完毕，可以点点小手赞一下
🌻 发现错误，直接评论区中指正吧
📆 橡皮擦的第 621 篇原创博客

畅销专栏，打折促销中~

文章目录

⛳️ 实战场景

本篇博客的目标站点跟网易有关，以下是详细的描述信息。

目标站点：https%3A%2F%2Fcomment.tie.163.com%2FH5GDH6RA0552DNJF.html；
站点名称：\\u7f51\\u6613\\u8ddf\\u5e16

本次抓取的前提是假设你可以采集到列表页数据，列表页如下所示：

点击任意热帖，进入评论页，通过开发者工具捕获到如下信息。

请求地址：https://Python脱敏处理163.com/api/v1/products/a2869674571f77b5a0867c3d71db5856/threads/H5GDH6RA0552DNJF/comments/newList?ibc=newspc&limit=30&showLevelThreshold=72&headLimit=1&tailLimit=2&offset=90&callback=jsonp_1650620067890&_=1650620067891
请求方式：GET

使用浏览器直接访问接口，可以获取到数据，但是其中涉及两个值需要进行分析，分别如下所示：

a2869674571f77b5a0867c3d71db5856：一个 md5 加密之后的值，被加密参数未知；
H5GDH6RA0552DNJF：含义未知。

编写简单的请求代码，查看代码中是否有时间相关的密处理。

import requests

res = requests.get('https://Python脱敏处理163.com/api/v1/products/a2869674571f77b5a0867c3d71db5856/threads/H5GDH6RA0552DNJF/comments/newList?ibc=newspc&limit=30&showLevelThreshold=72&headLimit=1&tailLimit=2&offset=30&callback=jsonp_1650621196302&_=1650621196303')
print(res.text)

数据直接返回了，看起来用不到复杂的解密技巧了，其中相关参数我们都能直接获取。

下面我们还是要找一下上文提及的两个参数，到底是如何计算得来的。