python超精简博客园爬虫(果然比C#好用的多)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python超精简博客园爬虫(果然比C#好用的多)相关的知识,希望对你有一定的参考价值。

无意间看到了网上python爬1024的文章,就想着晚点自己去撸一个全自动小电影下载器(就不用每次选半天了),上班挂着,下班回去就可以看了(身体已经被妹纸掏空了,还看),于是自己先试着写一个简单的爬虫,目标自然是博客园:使用简单的正则表达式匹配,当然也可以使用网上广泛使用的BeautifulSoup解析网页

import requests
import re

baseUrl = "https://www.cnblogs.com/"
html = requests.get(baseUrl).text
items=re.findall("_blank\\">(.+)</a></h3>",html)
for i in items:
  print(i)
print("") 
print("over")

爬的内容非常简单,就是首页上的文章列表,虽然C#也可以做,但是感觉python真的是精简,几句代码就搞定了,厉害了word python!效果如下

技术分享

已经等不及下班回去开干了!

以上是关于python超精简博客园爬虫(果然比C#好用的多)的主要内容,如果未能解决你的问题,请参考以下文章

Python 初试爬虫博客园

Python爬虫爬取博客园并保存

利用Abot 抓取博客园新闻数据

python学习第一弹:爬虫(抓取博客园新闻)

python爬虫:两种方法模拟登录博客园

Python爬虫入门教程 54-100 博客园等博客网站自动评论器