Python爬虫编程思想（126）：项目实战--实时抓取“得到”App在线课程

Posted 2022-08-13 蒙娜丽宁

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫编程思想（126）：项目实战--实时抓取“得到”App在线课程相关的知识，希望对你有一定的参考价值。

本文会给出一个真实的爬虫项目，这个爬虫项目抓取了“得到”App的在线课程列表。现在运行“得到”App，进入课程列表，会看到如图1所示的页面。

这个爬虫要抓取的就是全部的课程列表，不过这个爬虫与前面章节实现的爬虫有些不同，是实时抓取的，那么什么是实时抓取的呢？在前面章节实现的爬虫，都是先用开发者工具进行分析，提取出要抓取页面的URL和其他信息，然后再使用Python语言根据这些信息编写爬虫应用。这种方式并不是实时的，因为在浏览器中显示页面时，并没有用爬虫抓取数据，而只是在浏览器的开发者工具中分析这些数据，然后根据分析结果模拟浏览器来抓取数据。

这种传统的编写爬虫的方式对于Web应用通常没什么问题，因为Web应用的前端没有任何秘密，都

以上是关于Python爬虫编程思想（126）：项目实战--实时抓取“得到”App在线课程的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫编程思想（91）：项目实战--支持搜索功能的图片爬虫

Python爬虫编程思想（143）：项目实战：多线程和多进程爬虫

Python爬虫编程思想（92）：项目实战：抓取京东图书评价