Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息相关的知识,希望对你有一定的参考价值。
本文会利用requests库抓取起点中文网上的小说信息,并通过XPath提取相关的内容,最后将经过提取的内容保存到Excel文件中。本例需要使用第三方的xlwt库,该库用来通过Python操作Excel文件,需要使用下面的命令安装xlwt库。
pip install xlwt
使用xlwt库非常简单,首先需要创建一个workbook,相当于一个Excel文件,然后在workbook中添加若干个Sheet,接下来在每一个Sheet中的指定单元格(Cell)添加文本,最后使用workbook的save方法保存Excel文件。完整的实现代码如下:
import xlwt
# 创建Workbook对象,并指定编码为utf-8
book = xlwt.Workbook(encoding=\'utf-8\')
# 添加第1个Sheet,名称为Sheet1
sheet1 = book.add_sheet(\'Sheet1\')
# 添加第2个Sheet,名称为Sheet2
sheet2 = book.add_sheet(\'Sheet2\')
# 向第1个Sheet的Cell(1,1)位置添加文本
sheet1.write(1,1,\'世界,你好\')
# 向第1个Sheet
以上是关于Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(92):项目实战:抓取京东图书评价
Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程
Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程