数据分析系列 之python中便捷数据的获取(数据获取补充)

Posted 琅晓琳

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析系列 之python中便捷数据的获取(数据获取补充)相关的知识,希望对你有一定的参考价值。

1 怎样读取/写入csv文件数据?

import pandas as pd
#读取
df = pd.read_csv('c/test/test.csv')
#帮助信息
help(pd.read_csv)
#写入
df.to_csv('...')

#excel同理
#读取
df = pd.read_excel('c/test/test.xlsx', sheet_name = 'scores')
#计算
df['sum'] = df['Python'] + df['Math']
#写入
df.to_excel('c/test/scores.xlsx', sheet_name = 'scores')

2 读取网页中的数据?

# -*- coding: utf-8 -*-
import requests
import re
import pandas as pd

def retrieve_dji_list():
    r = requests.get('https://money.cnn.com/data/markets/nasdaq/')
    #正则表达式
    search_pattern = re.compile()
    #正则表达式模块的findall()
    dji_list_in_text = re.findall()
    #存入dji_list中
    dji_list = []
    for item in dji_list_in_text:
    	dji_list.append()
    return dji_list

#调用
dji_list = retrieve_dji_list()
djidf = pd.DataFrame(dji_list)
print(djidf)

补充资料:
数据集获取:
kaggle.com/datasets
sklearn模块的datasets
NLTK语料库
参考资料:
https://www.icourse163.org/learn/NJU-1001571005?tid=1463102441&from=study#/learn/content?type=detail&id=1240380188&cid=1261816417 用python玩转数据

以上是关于数据分析系列 之python中便捷数据的获取(数据获取补充)的主要内容,如果未能解决你的问题,请参考以下文章

python系列之BeautifulSoup的用法

7Python全站之路系列之MySQL视图

Python爬虫之Scrapy框架系列——项目实战某瓣top250电影信息获取

Python爬虫之Scrapy框架系列——项目实战某瓣top250电影信息获取

数据分析系列 之python中数据的可视化

数据分析系列 之python中数据探索与预处理