Python-爬虫-爬取知乎的标题和当页显示的文字

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python-爬虫-爬取知乎的标题和当页显示的文字相关的知识,希望对你有一定的参考价值。

# coding:utf-8
import requests
from bs4 import BeautifulSoup

quesNumStr = str(input("请输入搜索关键字:"))

url = ‘https://www.zhihu.com/search?type=content&q=‘+quesNumStr

headers = {
    ‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36‘  # your user-Agent here
}

data = requests.get(url, headers=headers)
soup = BeautifulSoup(data.text, ‘lxml‘)
liList = soup.select(‘li‘)
print(len(liList))
for li in liList:
    try:
        temp1 = li.select(‘a[class="js-title-link"]‘)
        if temp1:
            print(‘The title is :‘)
            print(temp1[0].get_text())
        temp2 = li.select(‘div[class="summary hidden-expanded"]‘)
        if temp2:
            print(‘The content is:‘)
            print(temp2[0].text)
    except:
        pass

 

以上是关于Python-爬虫-爬取知乎的标题和当页显示的文字的主要内容,如果未能解决你的问题,请参考以下文章

如何使用python爬取知乎数据并做简单分析

怎样用Python设计一个爬虫模拟登陆知乎

怎样用Python设计一个爬虫模拟登陆知乎

java 利用jousp 爬取知乎首页问题

Python爬取知乎与我所理解的爬虫与反爬虫

Python爬虫实战,Scrapy实战,爬取知乎表情包