bs4常用用法

Posted inorilzy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bs4常用用法相关的知识,希望对你有一定的参考价值。

from bs4 import BeautifulSoup
import requests
#获取爬去的网址
url=requests.get(‘https://movie.douban.com/subject/24773958/‘)
#获取网页源代码

v_source=BeautifulSoup(url.text,‘lxml‘)
# print(v_source)
# 爬取标题
v_title=v_source.find(‘span‘,attrs={‘property‘:‘v:itemreviewed‘})
#print(v_title.text)

v_jianjie=v_source.find(‘span‘,attrs={‘property‘:‘v:summary‘})
print(v_jianjie.text)

v_leixing=v_source.find_all(‘span‘,attrs={‘property‘:‘v:genre‘})
# for i in range(len(v_leixing)):
# print(v_leixing[i].text,end=‘ ‘)

for i in v_leixing:
print(i.text)




















以上是关于bs4常用用法的主要内容,如果未能解决你的问题,请参考以下文章

爬虫 requests,bs4 用法示例

bs4和xpath的用法

常用模块文档地址

bs4.BeautifulSoup的基础用法导入

DataGridView的常用用法

Python爬虫bs4解析实战