个人爬虫入门记录20171025
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了个人爬虫入门记录20171025相关的知识,希望对你有一定的参考价值。
作为一个NBA马刺的粉丝,我想看到比赛的数据,比如比分、场均得分、助攻等等,网易NBA有专门的数据页面来展示这些数据,所以我想通过爬虫的方法,把数据抓取下来,按照我自己的想法去展示。
从网上下载了一段代码,试跑了一下,能把网页的源代码下载下来。那我觉得接下来的工作就是文本处理,或者说其实爬虫的主要工作就是文本处理。从源代码中,获取、定位、剥离、存储我所需要的文本。
以上是关于个人爬虫入门记录20171025的主要内容,如果未能解决你的问题,请参考以下文章