个人爬虫入门记录20171025

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了个人爬虫入门记录20171025相关的知识,希望对你有一定的参考价值。

     作为一个NBA马刺的粉丝,我想看到比赛的数据,比如比分、场均得分、助攻等等,网易NBA有专门的数据页面来展示这些数据,所以我想通过爬虫的方法,把数据抓取下来,按照我自己的想法去展示。

      从网上下载了一段代码,试跑了一下,能把网页的源代码下载下来。那我觉得接下来的工作就是文本处理,或者说其实爬虫的主要工作就是文本处理。从源代码中,获取、定位、剥离、存储我所需要的文本。

以上是关于个人爬虫入门记录20171025的主要内容,如果未能解决你的问题,请参考以下文章

如何入门 Python 爬虫

Python爬虫入门20:掘金网全站用户爬虫 scrapy

入门|Python爬虫架构介绍

python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习

Python爬虫实践入门,超详细

简简单单的一篇小文章记录下urllib库的使用python爬虫入门进阶(02-2)