爬取校园新闻首页的新闻

Posted 李文辉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬取校园新闻首页的新闻相关的知识,希望对你有一定的参考价值。

import requests
re=requests.get(http://news.gzcc.cn/html/xiaoyuanxinwen/)
re.encoding=utf-8
from bs4 import BeautifulSoup
soup = BeautifulSoup(re.text,html.parser)
#print(soup.select(‘li‘))
for news in soup.select(li):
    if len(news.select(.news-list-title))>0:
        d=news.select(.news-list-title)[0].text
        e = news.select(.news-list-description)[0].text
        r = news.select(.news-list-info)[0].text
        #print(d)
        f=news.select(a)[0].attrs[href]
        #f=news.a.attrs[‘href‘]
        print(e,f)
        print(d,r)

        res = requests.get(f)
        res.encoding = utf-8
        soupd = BeautifulSoup(res.text, html.parser)
        #print(soupd.select(‘.show-content‘)[0].text)
        print(soupd.select(.show-info)[0].text[0:25])
        print(soupd.select(.show-info)[0].text[30:38])
        print(soupd.select(.show-info)[0].text[38:45])
        print(soupd.select(.show-info)[0].text[46:56])
        print(soupd.select(.show-info)[0].text[62:])
        break

 

以上是关于爬取校园新闻首页的新闻的主要内容,如果未能解决你的问题,请参考以下文章

爬取校园新闻首页的新闻

爬取校园新闻首页的新闻

爬取校园新闻首页的新闻

爬取校园新闻首页的新闻

爬取校园新闻首页的新闻

爬取校园新闻首页的新闻