python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错相关的知识,希望对你有一定的参考价值。
#!/usr/bin/python
# -*- coding: utf8 -*-
from pyquery import PyQuery as pyq
import sys
reload(sys)
sys.setdefaultencoding('utf8')
def translate():
url = r'http://dict.youdao.com/search?q=' + sys.argv[1]
doc = pyq(url)
doc('#custheme').remove()
doc('.c-topbar').remove()
doc('.c-subtopbar').remove()
doc('.c-header').remove()
doc('#c_footer').remove()
doc('.c-bsearch').remove()
doc('#ads').remove()
doc('#rel-search').remove()
doc('.error-wrapper').remove()
doc('#topImgAd').remove()
doc('#container').css('margin', '0')
doc('#results').css('margin-left', '10px');
doc('#results-contents').css('width', '480px')
doc('#results-contents').css('margin', '0')
doc('#result_navigator').css('left', '550px')
link = u"<a href='" + url + u"'>在浏览器中查看翻译</a>"
doc('#results-contents').append(link)
print doc.outerHtml()
if __name__ == "__main__":
translate()
sys.exit(0)
以上是关于python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错的主要内容,如果未能解决你的问题,请参考以下文章
python "爬虫+有道词典"实现一个简单翻译程序
python3网络爬虫实现有道词典翻译功能
Python3网络爬虫:利用urllib.urlopen向有道翻译发送数据获得翻译结果
有道词典翻译(携带请求头和post参数请求)
怎么在百度浏览器上用有道自动翻译?
Django怎么调用有道词典或金山词典api获取单词发音?