笔趣阁小说-雪中悍刀行-爬虫源代码

Posted luoters

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了笔趣阁小说-雪中悍刀行-爬虫源代码相关的知识,希望对你有一定的参考价值。

 1 import re
 2 import requests
 3 from bs4 import BeautifulSoup
 4 
 5 url = http://www.biquge6.com/11_11147/
 6 r = requests.get(url)
 7 b = BeautifulSoup(r.content.decode(gbk))
 8 h = b.find_all(href = re.compile(/11_11147/))       #正则匹配属性值带有/104_104216/的href标签,并返回正则模式对象h
 9 
10 list_len = len(h)      #剔除掉最新12章节
11 print(开始下载:)
12 i = 1
13 for each in h:
14     print(正在下载第 + str(i) + 章,共 + str(list_len) + )
15     url1 = url + each.get(href)[10:]                  #,获取其中一个超链接地址第12位后的链接地址
16     re = requests.get(url1)                             #每章节完整链接地址
17     bs = BeautifulSoup(re.content.decode(gbk))        #获取章节数据
18     t = bs.find_all(h1)[0].text[1:]            #find_all获取章节文章标题,[0].text[1:]截取标题内容
19 
20     content = bs.find_all(id = content)[0].text         # 数据清洗,清除html的多余标签
21     content = content.replace(xa0*8, ).replace(    , ‘‘).replace(

, 
)
22     content = t + 

 + content +



          # 将标题和内容整合
23     with open(雪中悍刀行.doc, a, encoding=utf-8) as f:
24         f.write(content)
25     i+=1
26 print(下载完成!)

----左手举个栗子,右手举个锤子----

以上是关于笔趣阁小说-雪中悍刀行-爬虫源代码的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫+数据分析+数据可视化(分析《雪中悍刀行》弹幕)

Python可视化分析《雪中悍刀行》,看看它为什么这么火?

用 Python 爬取了《雪中悍刀行》数据,终于知道它为什么这么火了

用爬虫爬取笔趣阁小说

爬虫实战:爬笔趣阁小说

python入门学习之Python爬取最新笔趣阁小说