抓取58同城二手手机一个列表页的对应详情页的内容

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抓取58同城二手手机一个列表页的对应详情页的内容相关的知识,希望对你有一定的参考价值。

本来是根据教程上的是区分个人和商家的,但是教程是15年的58同城网站进行了改版,个人的二手物品时跳转转转的,商家的还在58,所以两个详情页面的标签不再通用,没有实现个人和商家页面的跳转。代码如下:

from bs4 import BeautifulSoup
import requests
import time
url = ‘http://zhuanzhuan.58.com/detail/883905856824967177z.shtml
def get_links_from(who_sells):
urls = []
list_view = ‘http://bj.58.com/shouji/{}/‘.format(str(who_sells))
web_date = requests.get(list_view)
soup = BeautifulSoup(web_date.text,‘lxml‘)
for link in soup.select(‘td.t a.t‘):
urls.append(link.get(‘href‘))
return urls

def get_info(who_sells=0):
urls = get_links_from(who_sells)
for url in urls:
web_date = requests.get(url)
soup = BeautifulSoup(web_date.text,‘lxml‘)

data = {
‘title‘:soup.title.text,
‘price‘:soup.select(‘span.price_now ‘)[0].text if soup.find_all(‘span‘,‘price_now‘) else None,
‘area‘: soup.select(‘div.palce_li > span > i ‘)[0].text if soup.find_all(‘div‘,‘palce_li‘) else None,
‘catr‘:‘个人‘if who_sells==0 else ‘商家‘,
‘view‘:None,
}
print(data)
get_info()

以上是关于抓取58同城二手手机一个列表页的对应详情页的内容的主要内容,如果未能解决你的问题,请参考以下文章

DEDEcms手机网站添加详情内页上一页/下一页的翻页功能

vue-router打开新的tab页时,其内容是上一个tab页的内容问题

05 爬取华为官网VMALL的手机评论

python 爬虫抓取今日头条街拍图片

利用Tesseract识别58同城图片式手机号码

vue中跳转到详情页的两种方法