Python调用GithubAPI并进行初步的数据分析

Posted lesliechan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python调用GithubAPI并进行初步的数据分析相关的知识,希望对你有一定的参考价值。

找到一个Github 上的公开api

url = ‘https://api.github.com/search/repositories?q=language:python&sort=stars

技术图片

 

 

 网页内容是一个巨大的Python字典,我们来获取一些信息内容

包括文章所获得星数,文章名,以及文章的链接。

首先,展示一下成品

技术图片

 

 

 

 下面展示具体的操作过程:

首先请求该url

import requests
url = ‘https://api.github.com/search/repositories?q=language:python&sort=stars‘

r = requests.get(url)

print("Status Code:" ,r.status_code)输出

输出结果为:

技术图片

 

 说明url请求成功

我们将其json格式化,就获得了之前提到的巨大的json格式的字典

在根据字典的key值,提取对应所需要的value,并将其存入列表。

调用Pygal模块,来将数据进行可视化

 

以下是具体的实现代码:

import requests
import pygal
from pygal.style import  LightColorizedStyle as LCS, LightenStyle as LS

url = ‘https://api.github.com/search/repositories?q=language:python&sort=stars‘

r = requests.get(url)

print("Status Code:" ,r.status_code)

response_dict = r.json()

print("Total repositories:" ,response_dict[‘total_count‘])

repo_dicts = response_dict[‘items‘]
#print("Repositories returned:" ,len(repo_dicts))


names, plot_dicts = [], []
for repo_dict in repo_dicts:
    names.append(repo_dict[‘name‘])  #文章名

    if repo_dict[‘description‘]:
        plot_dict = 
            ‘value‘: repo_dict[‘stargazers_count‘],  #星数
            ‘label‘: repo_dict[‘description‘],  #文章描述
        
        plot_dicts.append(plot_dict)
    else:
        plot_dict = 
            ‘value‘: repo_dict[‘stargazers_count‘],
            ‘label‘: ‘None‘
        
        plot_dicts.append(plot_dict)

#格式设置 my_style = LS(‘#333366‘,base_style=LCS)  # 333366灰色 my_config = pygal.Config() my_config.x_label_rotation = 45 my_config.show_legend = False my_config.title_font_size = 24 my_config.label_font_size = 14 my_config.major_label_font_size = 18 my_config.truncate_label = 15 my_config.show_y_guides = False my_config.width = 1000 chart = pygal.Bar(my_config,style = my_style) chart.title = ‘Most-Starred Python Project on Github‘ chart.x_labels = names chart.add(‘‘,plot_dicts) chart.render_to_file(‘python_repos.svg‘)

 

运行过后,会在同目录下生成一个svg文件,里面所呈现的数据包括了星数,文章名,文章简介等。

用浏览器可直接打开,便可以看到条状图成果。

以上是关于Python调用GithubAPI并进行初步的数据分析的主要内容,如果未能解决你的问题,请参考以下文章

如何在python中使用github api token进行请求

Python进行数据分析初步学习2

初步使用Node连接Mysql数据库

对Python数据分析的初步认知

python简易的大乐透数据获取及初步分析

关于python函数的初步理解