1)python 爬取小说

Posted chuangjie1988

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1)python 爬取小说相关的知识,希望对你有一定的参考价值。

#!/usr/bin/env python 
# -*- coding: utf-8 -*-

import requests
from pyquery import PyQuery as pq


url = http://wwwm/203031
headers = {
    User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36
                   (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36
}

# 请求网页链接 获取页面源码
r = requests.get(url, headers=headers).text
doc = pq(r)
# 获取网页的全部章节链接 这里去掉了前面的最新章节部分 直接从第一章开始 
# div#book_detail:nth-child(2) 选取的是第二个div的内容
links = doc(div[@class="mulu"] li a).items()
print(links)
for link in links:   
    download_url = link.attr(href)
    print(download_url)
    # 请求每个章节
    download_page = requests.get(http://.com/+download_url, headers=headers).text
    # 获取每一章节的源码
    doc = pq(download_page)
    # 获取每一章小说的内容
    contents = doc(div[@class="mcc"]).text()
    with open(无限化.txt, a+, encoding=utf8) as f:
        f.write(link.text()+"

")
        f.write(contents+"

")
print("写入文件完成!请查看")

 

以上是关于1)python 爬取小说的主要内容,如果未能解决你的问题,请参考以下文章

40行代码爬取金庸所有武侠小说

python正则表达式——爬取网络小说实例

Python爬虫爬取目标小说并保存到本地

教你用Python批量爬取小说!这年头了谁看小说还充钱啊!

python入门学习之Python爬取最新笔趣阁小说

Python爬取小说网站下载小说