python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错相关的知识,希望对你有一定的参考价值。

#!/usr/bin/python
# -*- coding: utf8 -*-
from pyquery import PyQuery as pyq
import sys

reload(sys)
sys.setdefaultencoding('utf8')


def translate():
    url = r'http://dict.youdao.com/search?q=' + sys.argv[1]
    doc = pyq(url)
    doc('#custheme').remove()
    doc('.c-topbar').remove()
    doc('.c-subtopbar').remove()
    doc('.c-header').remove()
    doc('#c_footer').remove()
    doc('.c-bsearch').remove()
    doc('#ads').remove()
    doc('#rel-search').remove()
    doc('.error-wrapper').remove()
    doc('#topImgAd').remove()
    doc('#container').css('margin', '0')
    doc('#results').css('margin-left', '10px');
    doc('#results-contents').css('width', '480px')
    doc('#results-contents').css('margin', '0')
    doc('#result_navigator').css('left', '550px')

    link = u"<a href='" + url + u"'>在浏览器中查看翻译</a>"
    doc('#results-contents').append(link)
    print doc.outerHtml()


if __name__ == "__main__":
    translate()
    sys.exit(0)

以上是关于python 抓取有道词典网页版本翻译内容,并去掉翻译无关的广告等内容。结合GoldenDict的划词翻译,可以作为Linux的下的有道词典客户端。效果还不错的主要内容,如果未能解决你的问题,请参考以下文章

python "爬虫+有道词典"实现一个简单翻译程序

python3网络爬虫实现有道词典翻译功能

Python3网络爬虫:利用urllib.urlopen向有道翻译发送数据获得翻译结果

有道词典翻译(携带请求头和post参数请求)

怎么在百度浏览器上用有道自动翻译?

Django怎么调用有道词典或金山词典api获取单词发音?