python scrapy 调试模式

Posted zzcpy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python scrapy 调试模式相关的知识,希望对你有一定的参考价值。

scrapy通过命令行创建工程,通过命令行启动爬虫,那么有没有方式可以在IDE中调试我们的爬虫呢?

实际上,scrapy是提供给我们工具的,

1. 首先在工程目录下新建一个脚本文件,作为我们执行爬虫的入口以取代命令行模式。

2. 编写代码:

from scrapy.cmdline import execute
import os
import sys
sys.path.append(os.path.dirname(os.path.abspath(__file__))) # 把我们的目录导入到环境变量中
if __name__ == __main__:
    execute([scrapy,crawl,my_spider])

windows下调试可能会报 确实 model win32api的错误。只需要安装 pypiwin32就能解决这个问题: pip install pypiwin32

以上是关于python scrapy 调试模式的主要内容,如果未能解决你的问题,请参考以下文章

scrapy按顺序启动多个爬虫代码片段(python3)

python网络爬虫之scrapy 调试以及爬取网页

使用pycharm运行调试scrapy

python爬虫scrapy之scrapy终端(Scrapy shell)

转载Python爬虫框架Scrapy学习笔记

Python爬虫Scrapy框架IP代理的配置与调试