python简单爬虫

Posted shihun

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python简单爬虫相关的知识,希望对你有一定的参考价值。

      学了几天python,写了个简单的爬虫程序(爬取酷我音乐排行榜):

 

 1 #! -*- coding:utf-8 -*-
 2 
 3 import requests
 4 import pyquery
 5 from pyquery import PyQuery as pq
 6 
 7 # 爬取酷我音乐排行榜
 8 headers = {
 9     User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0}  # 设置User-Agent头,绕过反爬虫机制
10 url = "http://www.kuwo.cn/bang/index"  # 爬取的地址
11 html = requests.get(url, headers=headers)  # 获取网页内容
12 a = pq(html.text)
13 b = a(.name).find(a)
14 for c in b.items():
15     print(c.html())
16 print("爬取完成!")
17 
18 
19  

 

以上是关于python简单爬虫的主要内容,如果未能解决你的问题,请参考以下文章

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段

[Python]python爬虫简单试用

5行python代码实现简单的网络爬虫

如何用最简单的Python爬虫采集整个网站

python 用于在终端中运行的sublime text 3的简单代码片段制作工具