Python爬虫编程思想(49):Beautiful Soup环境搭建
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(49):Beautiful Soup环境搭建相关的知识,希望对你有一定的参考价值。
目录
1. Beautiful Soup简介
Beautiful Soup是一个强大的基于Python语言的XML和html解析库,可以用它来方便地从网页中提取数据,那么Beautiful Soup到底有什么功能呢?先看一段对Beautiful Soup的标准解释。
Beautiful Soup提供了一些简单的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,由于Beautiful Soup非常简单,所以可以用非常少的代码写出一个完整的HTML分析程序,再加上requests库,可以写出非常简洁且强大的爬虫应用。
Beautiful Soup自动将输入的文档转换为Unicode编码,输出文档转换为UTF-8编码,所以在使用Beautiful Soup的过程中并不需要考虑编码问题,除非文档没有指定编码方式,这时只需要指出输入文档的编码方式即可。
以上是关于Python爬虫编程思想(49):Beautiful Soup环境搭建的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程