scrapy 入门爬取新闻
Posted icode-girl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy 入门爬取新闻相关的知识,希望对你有一定的参考价值。
为文本分类实验爬取数据集,要求一百万,分类>10类。
参考链接:http://litianyi.cc/technology/2015/12/01/text-classification-1/
文档:https://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.html
最基础的爬取,实验新浪科技大概3k+,腾讯科技5k+,一财5w+,就爬不动了。
以上是关于scrapy 入门爬取新闻的主要内容,如果未能解决你的问题,请参考以下文章
第三百三十四节,web爬虫讲解2—Scrapy框架爬虫—Scrapy爬取百度新闻,爬取Ajax动态生成的信息