客户要求1000块做个百度,Python10行代码解决

Posted 士别三日wyx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了客户要求1000块做个百度,Python10行代码解决相关的知识,希望对你有一定的参考价值。

「作者主页」:士别三日wyx


        1000块钱做个百度?能提出这种要求的客户实乃乙方克星、民族之光、科创永动机、西虹市一大杰出青年,诺奖永远得不到的人才。

        但作为一个硬核的程序员,没有什么功能是我们实现不了的,如果有,那就是钱没到位。因此,我们要用魔法打败魔法,10行代码给他写一个百度搜索。

1. 获取百度搜索接口


        地址栏中有很多参数,但实际有用的参数只有 wd ,只需要保留这一个参数即可,其余删掉。

url = 'https://www.baidu.com/s?wd=士别三日wyx'

2. 指定搜索内容

        搜索内容肯定不能写死,需要由用户「输入」

kw = input('百度一下:')
url = 'https://www.baidu.com/s?wd=' + kw

3. UA伪装

        利用百度的接口发送「请求」,获取响应内容。

        大部分网站都会对用户的请求进行「过滤」,以防止恶意攻击行为,比如查看是否是浏览器发出的请求

        「UA伪装」是指在HTTP请求头中添加 User-agent ,伪装成浏览器的请求,网站检查请求头时,发现有UA请求头,就会认为是浏览器的请求,从而放行。

headers = 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0',
response = requests.get(url=url, headers=headers)

4. 将响应内容写入文件

        响应的内容实际上就是构成页面的 html 代码,将响应内容写入HTML文件,就获得了百度搜索的响应页面

fileName = 'a.html'
with open(fileName, 'w', encoding='utf-8') as fp:
    fp.write(response.text)

5. 使用浏览器打开页面

        页面生成以后肯定不能再手动打开,那也太low了,使用默认「浏览器」自动打开生成的页面

webbrowser.open(fileName)

源码如下

import webbrowser
import requests
kw = input('百度一下:')
url = 'https://www.baidu.com/s?wd=' + kw
headers = 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0',
response = requests.get(url=url, headers=headers)
fileName = 'a.html'
with open(fileName, 'w', encoding='utf-8') as fp:
    fp.write(response.text)
webbrowser.open(fileName)

输入想要百度的内容,按下回车

即可自动使用默认浏览器打开搜索结果的页面

以上是关于客户要求1000块做个百度,Python10行代码解决的主要内容,如果未能解决你的问题,请参考以下文章

python10行代码,让你成功伪装逃过反爬虫程序

c# datagridview 绑定数据时逐行显示并且有进度条。问题如下:

2019年的代码都写完了吗?不如做个Python进度条看看还剩多少

10行Python代码写一个程序

Python爬虫 - 爬取百度html代码前200行

新手练手项目:10行Python代码写一个程序