Python 爬取糗事百科段子

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬取糗事百科段子相关的知识,希望对你有一定的参考价值。

直接上代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import re
import urllib.request

def gettext(url,page):
	headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36")
	opener=urllib.request.build_opener()
	opener.addheaders=[headers]
	urllib.request.install_opener(opener)
	data=urllib.request.urlopen(url).read().decode("utf-8")
	userpat='<h2>(.*?)</h2>'
	textpat='<div class="content">(.*?)</div>'
	userlist=re.compile(userpat,re.S).findall(data)
	textlist=re.compile(textpat,re.S).findall(data)
	dictionary=dict(zip(userlist,textlist))
	x=1
	for key,value in dictionary.items():
		value=value.replace("
","")
		value=value.replace("<span>","")
		value=value.replace("</span>","")
		value=value.replace("<br/>","
")
		print("第"+str(page)+"页"+str(x)+"用户"+key)
		print("内容:"+value)
		print('
')
		print("-----------------------------")
		x+=1

for i in range(1,3):
	url="https://www.qiushibaike.com/8hr/page/"+str(i)
	gettext(url,i)
	
	

执行结果

技术分享图片



以上是关于Python 爬取糗事百科段子的主要内容,如果未能解决你的问题,请参考以下文章

利用python爬取糗事百科的用户及段子

Python爬虫爬取糗事百科段子内容

Python爬虫实战一之爬取糗事百科段子

python爬取糗事百科段子

Python爬虫-爬取糗事百科段子

python 爬取糗事百科 gui小程序