python 爬取豆瓣电影案例

Posted zqrios

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 爬取豆瓣电影案例相关的知识,希望对你有一定的参考价值。

# conding=utf-8
from  parse import parse_url
import json
class DoubanSpider:

    def __init__(self):

        self.temp_url = "https://m.douban.com/rexxar/api/v2/subject_collection/filter_movie_occident_hot/items?os=android&for_mobile=1&callback=jsonp3&start={}&count=18&loc_id=108288&_=0"


    def get_content_list(self,html_str): #提取数据

        dict_data = json.loads(html_str)

        content_list = dict_data["subject_collection_items"]

        total =dict_data["total"]

        return content_list,total


    def save_content_list(self,content_list):

        with open("db.json","a",encoding="utf-8") as f:

            for content in content_list:

                f.write(json.dumps(content,ensure_ascii=False))

                f.write("\n")
                print(添加成功)

    def run(self): #实现主要逻辑

        num = 0

        total = 100

        while num < total + 18:
            # 1.start_url
            start_url = self.temp_url.format(num)

            # 2.发送请求,获取响应
            html_str = parse_url(start_url)

            # 3.提取数据
            content_list, total = self.get_content_list(html_str)

            # 4.保存
            self.save_content_list(content_list)

            # 5.构造下一页的url地址,循环2-5步
            num +=18



if __name__== __main__:
        douban = DoubanSpider()
        douban.run()

 

以上是关于python 爬取豆瓣电影案例的主要内容,如果未能解决你的问题,请参考以下文章

Python 从底层结构聊 Beautiful Soup 4(内置豆瓣最新电影排行榜爬取案例)!

python爬虫入门爬取豆瓣电影top250

python爬取豆瓣电影Top250(附完整源代码)

团队-Python 爬取豆瓣电影top250-需求分析

(Scrapy框架)爬虫获取豆瓣正在热映的电影信息,xpath属性爬取 | 爬虫案例

python爬取豆瓣电影图片并生成评分柱状图