Python爬虫编程思想(49):Beautiful Soup环境搭建

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(49):Beautiful Soup环境搭建相关的知识,希望对你有一定的参考价值。

目录

1. Beautiful Soup简介

2. 安装Beautiful Soup

1. Beautiful Soup简介

        Beautiful Soup是一个强大的基于Python语言的XML和html解析库,可以用它来方便地从网页中提取数据,那么Beautiful Soup到底有什么功能呢?先看一段对Beautiful Soup的标准解释。

        Beautiful Soup提供了一些简单的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,由于Beautiful Soup非常简单,所以可以用非常少的代码写出一个完整的HTML分析程序,再加上requests库,可以写出非常简洁且强大的爬虫应用。

        Beautiful Soup自动将输入的文档转换为Unicode编码,输出文档转换为UTF-8编码,所以在使用Beautiful Soup的过程中并不需要考虑编码问题,除非文档没有指定编码方式,这时只需要指出输入文档的编码方式即可。

以上是关于Python爬虫编程思想(49):Beautiful Soup环境搭建的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想:网络爬虫的基本原理

Python爬虫编程思想(12):搭建代理与使用代理

Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程

Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程

Python爬虫编程思想(13):读取和设置Cookie

Python爬虫编程思想(162): 综合爬虫项目:可视化爬虫