爬豆瓣电影名

Posted byerHu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬豆瓣电影名相关的知识,希望对你有一定的参考价值。

import urllib.request
from bs4 import BeautifulSoup

url = "https://movie.douban.com/chart"
req = urllib.request.Request(url)
req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:54.0) Gecko/20100101 Firefox/54.0")
response = urllib.request.urlopen(url)
bsObj = BeautifulSoup(response, \'html.parser\')
bsObj = bsObj.find_all(\'div\', {\'class\': \'pl2\'})
print(bsObj[0].contents[1].get_text())
for tag in bsObj:

    div_tag = tag.contents[1].get_text()

    name = div_tag.strip(\'\\n\').replace(\' \', \'\') +\'\\n\'

    print(name)

 

以上是关于爬豆瓣电影名的主要内容,如果未能解决你的问题,请参考以下文章

团队-团队编程项目爬取豆瓣电影top250-代码设计规范

用Scrapy爬虫爬取豆瓣电影排行榜数据,存储到Mongodb数据库

基于python的scrapy框架爬取豆瓣电影及其可视化

python爬虫入门爬取豆瓣电影top250

selenium+PhantomJS小案例—爬豆瓣网所有电影代码python

pyspider爬豆瓣电影实例