自定义代理IP

Posted xiongfanyong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自定义代理IP相关的知识,希望对你有一定的参考价值。

自定义proxy.py
    import base64
    import random
    from urllib.parse import unquote, urlunparse
    from urllib.request import _parse_proxy

    from scrapy.utils.python import to_bytes


    class XdbProxyMiddleware:

        def _basic_auth_header(self, username, password):
            user_pass = to_bytes(
                %s:%s % (unquote(username), unquote(password)),
                encoding=latin-1)
            return base64.b64encode(user_pass)

        def process_request(self, request, spider):
            PROXIES = [
                        http://125.108.106.165:9000/,
                    ]
            url = random.choice(PROXIES)
            orig_type = ‘‘
            proxy_type, user, password, hostport = _parse_proxy(url)
            proxy_url = urlunparse((proxy_type or orig_type, hostport, ‘‘, ‘‘, ‘‘, ‘‘))

            if user:
                creds = self._basic_auth_header(user, password)
            else:
                creds = None
            # 给请求头里面换成随机代理IP
            request.meta[proxy] = proxy_url
            print(request.meta.get(proxy))
            if creds:
                # 加入代理用户认证
                request.headers[Proxy-Authorization] = bBasic  + creds
在配置文件中
    settings.py
        DOWNLOADER_MIDDLEWARES = {
           # ‘xdb.middlewares.XdbDownloaderMiddleware‘: 543,
           xdb.proxy.XdbProxyMiddleware: 751,
           # ‘scrapy.downloadermiddlewares.useragent.UserAgentMiddleware‘: None,
        }

 

以上是关于自定义代理IP的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段——CSS选择器

VSCode自定义代码片段6——CSS选择器

VSCode自定义代码片段(vue主模板)

VSCode自定义代码片段——声明函数

VSCode自定义代码片段——.vue文件的模板

VSCode自定义代码片段——git命令操作一个完整流程