《百年孤独》百度百科的爬取

Posted cqyqqx98576

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《百年孤独》百度百科的爬取相关的知识,希望对你有一定的参考价值。

一、参考网址:https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin

二、源代码:

import requests
def A():
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=‘utf-8‘
return r.text
except:
return ""
url=‘https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin‘
print(A())

三、成果:

技术图片

 

 

 

 

四、只爬取了文字没有爬取图片,可能我的成果难度系数比较低,望进一步学习爬虫熟练运用。

以上是关于《百年孤独》百度百科的爬取的主要内容,如果未能解决你的问题,请参考以下文章

多线程爬取百度百科

百度百科简介爬取(含源代码)

python爬虫—爬取百度百科数据

最最简单的python爬虫教程--爬取百度百科案例

最最简单的python爬虫教程--爬取百度百科案例

python爬取百度百科(根据爬取的热词自动匹配相应解释)且将数据存入数据库中