python beautifulsoup bs4爬虫 爬取糗事百科
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python beautifulsoup bs4爬虫 爬取糗事百科相关的知识,希望对你有一定的参考价值。
声明:仅用于学习语法,请勿用于非法用途
import urllib.request
import re
from bs4 import BeautifulSoup
# -*- coding:utf-8 -*-
url = ‘http://www.qiushibaike.com/hot/‘
user_agent=‘Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)‘
headers={‘User-Agent‘:user_agent}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
bsobj = BeautifulSoup(response.read(), "html5lib")
#content = response.read().decode(‘utf-8‘)
#print(bsobj)
nameList = bsobj.find_all("div", {"class":"content"})
for name in nameList:
print(name.get_text())
input_enter = str(input())
if input_enter ==‘‘:
continue
本文出自 “净空蓝星” 博客,谢绝转载!
以上是关于python beautifulsoup bs4爬虫 爬取糗事百科的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫 BeautifulSoup(bs4)-- bs4介绍安装bs4bs4基础语法
vscode Python 无法导入beautifulsoup4解决方案 (bs4报错:vscode unresolved import 'beautifulsoup4')
python beautifulsoup bs4爬虫 爬取糗事百科