python抓取内涵段子文章

Posted dongml

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python抓取内涵段子文章相关的知识,希望对你有一定的参考价值。

# coding:utf-8
from urllib.request import urlretrieve
import threading
import requests
from bs4 import BeautifulSoup
from datetime import datetime
import pymysql
import random
import  json
import  time

number=0
def GetArticel():
    max_time = 1519404642
    data = requests.get("http://www.neihanshequ.com/joke/?is_json=1&app_name=neihanshequ_web&max_time=" + str(max_time))
    soup = BeautifulSoup(data.text, ‘html5lib‘)
    #print(soup.select_one(‘body‘).get_text())

    global number
    jsondata=json.loads(str(soup.select_one(‘body‘).get_text()))
    articleList=jsondata[‘data‘][‘data‘]
    f = open("article.txt", ‘a‘,encoding=‘utf-8‘)
    for item in articleList:
       number+=1
       #print(number)

       f.write(item[‘group‘][‘content‘]+‘\n\n\n‘)
       print(number)
    f.close()



        # print(count)
        # print(item)


if __name__ == ‘__main__‘:

   for i in range(1,10):
    print(i)
    #GetArticel()
    #time.sleep(1)

  

以上是关于python抓取内涵段子文章的主要内容,如果未能解决你的问题,请参考以下文章

11-内涵段子-爬虫

Python爬取内涵段子里的段子

python3 爬虫内涵段子

没有内涵段子可以刷了,利用Python爬取段友之家贴吧图片和小视频(含源码)

内涵段子——脑筋急转弯——spider

(源码推荐)快速开发10几天时间纯代码高仿《内涵段子》