Python 爬虫神器 requests 工具

Posted Yxh_blogs

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬虫神器 requests 工具相关的知识,希望对你有一定的参考价值。

一、模块安装

pip install requests

二、常用方法

在实际的爬虫中,其实真正用到的只有 GET、POST,像其他的方法基本用不到,比如:DELETE、HEAD、PUT 等。

1、GET 方法

headers = \'user-agent\': \'my-app/0.0.1\'
payload = \'key1\': \'value1\', \'key2\': \'value2\'
requests.get(url, params=payload, headers=headers)

2、POST 方法

headers = \'user-agent\': \'my-app/0.0.1\'
payload = \'key1\': \'value1\', \'key2\': \'value2\'
requests.post(url, data=payload, headers=headers)

3、参数设置

禁用证书验证
verify = False
如果爬取的目标网站是 HTTPS 的,那么需要设置下这个参数。

代理设置
proxies =
\'http\': \'http://10.10.1.10:3128\',
\'https\': \'http://10.10.1.10:1080\',

proxies = proxies
设置代理的目的是隐藏真实的IP地址,防止被禁IP地址。

HTTP Auth 认证

auth = HTTPBasicAuth(\'admin\', \'admin\')
如果网站设置了 Auth 认证,需要配置这个参数传递账号密码。

附:
requests地址 https://requests.readthedocs.io

三、案例

搞爬虫都是注重效率的,俗话说:"工欲善其,必先利其器"。那我们在这里利用一个工具将 CURL 请求直接生成 Python 代码。

复制网络请求的 CURL 命令。

将 CURL 命令转换成 Python 代码

最终生成的 Python 代码

附:
目标网址 https://spa1.scrape.center/
工具地址 https://curlconverter.com/python/

四、小结

1、requests 工具是编写爬虫程序中最常用的模块。
2、为了提高爬虫程序的编写效率直接使用 curlconverter 工具,将 curl 命令转换成 Python 代码。
3、本篇文章主要是作为笔记记录下,希望这些内容能够对你有帮助。

Python爬虫解密神器,无需知道哪种类型加密,全自动解密工具

 

Ciphey 是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。

简单地来讲,你只需要输入加密文本,它就能给你返回解密文本。就是这么牛逼。

有了Ciphey,你根本不需要知道你的密文是哪种类型的加密,你只知道它是加密的,那么Ciphey就能在3秒甚至更短的时间内给你解密,返回你想要的大部分密文的答案。

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:701698587

欢迎加入,一起讨论 一起学习!

 

下面就给大家介绍 Ciphey 的实战使用教程。

1.准备

开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章:超详细Python安装指南进行安装。

(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda: Python数据分析与挖掘好帮手—Anaconda ,它内置了Python和pip.

(可选2) 此外,推荐大家用VSCode编辑器,它有许多的优点: Python 编程的最好搭档—VSCode 详细指南 。

请选择以下任一种方式输入命令安装依赖:

1. Windows 环境 打开 Cmd (开始-运行-CMD)。

2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。

3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.

pip install -U ciphey

2.Ciphey 基本使用

有3种方法可以运行 Ciphey:

1.文件输入:

ciphey -f encrypted.txt
# 或
python -m ciphey -f encrypted.txt

2. 不规范的方法:

ciphey -- "Encrypted input"
# 或
python -m ciphey -- "Encrypted input"

3.正常方式

ciphey -t "Encrypted input"
# 或
python -m ciphey -t "Encrypted input"

如下图所示:

 

要去除进度条、概率表和所有噪音,请使用安静模式:

ciphey -t "encrypted text here" -q

3.在Python中调用Ciphey

如果你需要在Python中使用Ciphey,请这样使用:

# Python实用宝典
# 2021/07/19
from ciphey.__main__ import main, main_decrypt, make_default_config
main_decrypt(make_default_config("SGVsbG8gbXkgbmFtZSBpcyBiZWUgYW5kIEkgbGlrZSBkb2cgYW5kIGFwcGxlIGFuZCB0cmVl"))
# >> Hello my name is bee and I like dog and apple and tree

运行后会输出如下的结果:

 

效果还是相当不错的,如果你不想输出概率表,只想要解密内容,代码需要这么写:

# Python实用宝典
# 2021/07/19
from ciphey.__main__ import main, main_decrypt, make_default_config
config = make_default_config("SGVsbG8gbXkgbmFtZSBpcyBiZWUgYW5kIEkgbGlrZSBkb2cgYW5kIGFwcGxlIGFuZCB0cmVl")
config["grep"] = True
main_decrypt(config)
# >> Hello my name is bee and I like dog and apple and tree

 

非常Nice,你根本无需知道这是什么密文/编码。

以上是关于Python 爬虫神器 requests 工具的主要内容,如果未能解决你的问题,请参考以下文章

Python3 爬虫神器总结

Python3 爬虫神器总结

Python爬虫解密神器,无需知道哪种类型加密,全自动解密工具

Python3~爬虫工具使用requests库

Python爬虫解析神器-正则表达式如何正确运用?案例详解

Python爬虫解析神器-正则表达式如何正确运用?案例详解