Python爬虫|有道翻译(简易版)
Posted 向阳-Y.
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫|有道翻译(简易版)相关的知识,希望对你有一定的参考价值。
本篇文章利用url接口删除"_o",巧妙的避开了反爬措施,代码简单易懂,后续将出一篇进阶版
,不删除"_o"进行反爬
import requests
import json
#1.基于控制台获取输入-等待翻译的词语
content=input('请输入:')
#2.设定待请求的url
url='https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
#3.建立post表单
post_form={
'i': content,
'from': 'AUTO',
'to': 'AUTO',
'smartresult': 'dict',
'client': 'fanyideskweb',
'salt': '16347335106665',
'sign': 'db02fd478420666d08c63a3b7eae1520',
'lts': '1634733510666',
'bv': 'd5224460610b3619bf4d2f035423e0ab',
'doctype': 'json',
'version': '2.1',
'keyfrom': 'fanyi.web',
'action': 'FY_BY_REALTlME'
}
#提交post请求
response=requests.post(url,data=post_form)
#接收响应结果,并解析提取
trans_json=response.text
trans_dict=json.loads(trans_json)
result=trans_dict['translateResult'][0][0]['tgt']
print(result)
代码详解:
1.代码中的url从哪里来???
从该页发现了相关的值,于是抓取该页面的URL
获取到的页面为
url=‘https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule’
但是当试图进行抓取该接口时,并没有返回值(大概是有道的一种反爬手段)
解决办法(参照网上大佬的):删除translate后的_o
url=‘https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule’
代码中的post_form从哪里来??
以上是关于Python爬虫|有道翻译(简易版)的主要内容,如果未能解决你的问题,请参考以下文章