反爬虫机制----伪装User-Agent之fake-useragent

Posted yidanda888

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了反爬虫机制----伪装User-Agent之fake-useragent相关的知识,希望对你有一定的参考价值。

今天首先讲解反爬机制的伪装User-Agent

第一种:在cmd命令行里用pip安装fake_useragent

pip install fake-useragent

使用方法:

    from fake_useragent import UserAgent
    import random
     
    fake_ua=UserAgent() # 构建UserAgent()对象
    headers = {‘User-Agent‘:fake_ua.random} #用random来随机取得用户代理。

获取各浏览器的fake-useragent

    from fake_useragent import UserAgent
    ua = UserAgent()
    #ie浏览器的user agent
    print(ua.ie)
     
    #opera浏览器
    print(ua.opera)
     
    #chrome浏览器
    print(ua.chrome)
     
    #firefox浏览器
    print(ua.firefox)
     
    #safri浏览器
    print(ua.safari)
     
    #最常用的方式
    #写爬虫最实用的是可以随意变换headers,一定要有随机性。支持随机生成请求头
    print(ua.random)
    print(ua.random)
    print(ua.random)

 

第二种:百度搜索网上有很多,将其复制一些使用

附:

如何查看fake-useragent的版本?

有两种方法

第一种:

百度   pypi fake-useragent查看目前的版本,因为版本更新后有点没有数据

查到版本号,在地址栏中输入https://fake-useragent.herokuapp.com/browsers/版本号  比如现在最新的是:https://fake-useragent.herokuapp.com/browsers/0.1.11

就会看到所有的useragent,如图:

第二种:

在python中你安装fake-useragent时,进入python,使用命令pip list可以查看对应的版本
————————————————

原文链接:https://blog.csdn.net/ITYTI/article/details/83757118

以上是关于反爬虫机制----伪装User-Agent之fake-useragent的主要内容,如果未能解决你的问题,请参考以下文章

原创爬虫反爬基础常见类型总结

反爬虫之信息校验反爬虫

动态ip代理:反网络爬虫之设置User-Agent的常规方法

Python 爬虫篇 - 通过urllib.request伪装成浏览器绕过反爬虫爬取网页所有连接实例演示,urllib2库的安装

常见的一些反爬虫策略破解方式-Java网络爬虫系统性学习与实战系列(11)

常见的一些反爬虫策略破解方式-Java网络爬虫系统性学习与实战系列(11)