Pandas的使用
Posted Harris-H
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas的使用相关的知识,希望对你有一定的参考价值。
Pandas的使用
1.读取数据
读取数据的类型:
- csv文件
- txt文件
- xlsx格式excel文件
- mysql数据表
读取csv
import pandas as pd
# 读取csv
fpath = "./datas/ml-latest-small/ratings.csv"
# 使用pd.read_csv读取数据
ratings = pd.read_csv(fpath)
# 查看前几行数据
ratings.head()
# 查看数据的形状,返回(行数、列数)
ratings.shape
# 查看列名列表
ratings.columns
# 查看索引列
ratings.index
# 查看每列的数据类型
ratings.dtypes
读取txt
fpath = "./datas/crazyant/access_pvuv.txt"
pvuv = pd.read_csv(
fpath,
sep="\\t",
header=None,
names=['pdate', 'pv', 'uv']
)
pvuv
读取excel
fpath = "./datas/crazyant/access_pvuv.xlsx"
pvuv = pd.read_excel(fpath)
pvuv
读取mysql数据库
import pymysql
conn = pymysql.connect(
host='127.0.0.1',
user='root',
password='xxxxxx',
database='test',
charset='utf8'
)
mysql_page = pd.read_sql("select * from crazyant_pvuv", con=conn)
mysql_page
2.数据结构
-
Series
- Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。
-
DataFrame
-
DataFrame是一个表格型的数据结构
- 每列可以是不同的值类型(数值、字符串、布尔值等)
- 既有行索引index,也有列索引columns
- 可以被看做由Series组成的字典
创建dataframe最常用的方法,见02节读取纯文本文件、excel、mysql数据库
Series的相关操作
-
DataFrame的相关操作
loc是返回指定 i n d e x index index的行数据。
注意:与python切片不同,loc 的切片是包含末尾的!!!
3.查询数据
pandas使用loc函数可以较为方便的查询数据。
学习视频
以上是关于Pandas的使用的主要内容,如果未能解决你的问题,请参考以下文章
text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas