学习日记:Python爬虫-1

Posted 2021-03-09 vhhi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了学习日记:Python爬虫-1相关的知识，希望对你有一定的参考价值。

这几天在b站看小甲鱼的python3教程，照着写了个有道翻译的程序

代码中字典data中的内容，用浏览器审查元素，先随便输一个要翻译的，找到跳出来的post的那个网址，看formdata就行了

返回的是json格式的，故需解码

代码如下

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import urllib.parse
 5 import json
 6 
 7 url = ‘http://fanyi.youdao.co/translate?smartresult=dictsmartresult=rule‘
 8 data = {‘i‘:‘I love you‘,
 9 ‘from‘:‘AUTO‘,
10 ‘to‘:‘AUTO‘,
11 ‘smartresult‘:‘dict‘,
12 ‘client‘:‘fanyideskweb‘,
13 ‘salt‘:‘15818581248059‘,
14 ‘sign‘:‘16181e788bc7f326f5a3665a11dc1764‘,
15 ‘ts‘:‘1581858124805‘,
16 ‘bv‘:‘bbb3ed55971873051bc2ff740579bb49‘,
17 ‘doctype‘:‘json‘,
18 ‘version‘:‘2.1‘,
19 ‘keyfrom‘:‘fanyi.web‘,
20 ‘action‘:‘FY_BY_REALTlME‘}
21 
22 i = input("What do you want to translate?:
")
23 data[‘i‘] = i#传入要翻译的内容
24 data = urllib.parse.urlencode(data).encode(‘utf-8‘)#编码
25 response = urllib.request.urlopen(url,data)#post
26 html = response.read().decode(‘utf-8‘)#解码为utf-8
27 target = json.loads(html)#json解码
28 print(target[‘translateResult‘][0][0][‘tgt‘])#打印翻译内容

作用：直接翻译输入的内容，不需要打开浏览器了

注意：这里变量url中的网站本来带了 _o 这个玩意儿，不删会报错，不晓得原因QAQ

以上是关于学习日记:Python爬虫-1的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫日记02-数据可视化

爬虫日记(72)：Scrapy安装程序入口点分析

爬虫日记(106)：Twisted:单元测试怎么样编写