一段Python爬虫代码的分析
Posted 学习笔记
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一段Python爬虫代码的分析相关的知识,希望对你有一定的参考价值。
import re import requests from bs4 import BeautifulSoup from openpyxl import Workbook from openpyxl.styles import Alignment
requests:网页爬取的第三方库
re:内容解析模块,用于 正则表达式,处理字符串的模块。
BeautifulSoup=bs4:内容解析库,用于提取HTML和XML里的数据。
通常,Beautiful Soup库的使用:
from bs4 import BeautifulSoup #主要使用BeautifulSoup类
一个是库,一个是库里边的类。
openpyxl是读写 Excel 文件的 Python 库
workbook:
在刚开始使用openpyxl的时候,不需要直接在文件系统中创建一个文件,仅仅需要导入Workbook类并开始使用它:
from openpyxl import Workbook wb = Workbook()
openpyxl模块中与字体,颜色,背景,边框,字体,行宽,行高,单元格格式等相关的内容都放在了styles模块中;
styles能够提供的样式有以下几块:
Font:来设置文字的大小,颜色和下划线等
PatternFill:填充图案和渐变色
Border:单元格的边框
Alignment:单元格的对齐方式等
protection:写保护
以上是关于一段Python爬虫代码的分析的主要内容,如果未能解决你的问题,请参考以下文章
python爬虫,一段完整的python爬虫批量下载网站图片资源的代码