Pandas的DataFrame & Series详解
Posted 编程贝多芬
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas的DataFrame & Series详解相关的知识,希望对你有一定的参考价值。
Pandas数据结构
1.Series
2.DataFrame
3.从DataFrame中查询出Series
DataFrame: 二维数据、整个表格、多行多列
Series:一维数据,一行或者一列
import pandas as pd
import numpy as np
1、Series
Series是一种类似于一维数组的对象,它由一组数据〈不同数据类型)以及一组与之相关的数据标签(即索引)组成。
1.1仅有数据列表即可产生最简单的Series
左侧为索引,右侧为数据
s1=pd.Series([1,'x',5.7,7])
#左侧为索引,右侧为数据
s1
获取索引
s1.index
获取索引
s1.index
获取数据
s1.values
#获取数据
s1.values
1.2创建一个具有标签索引的Series
s2=pd.Series([1,'x',5.7,7],index=['d','b','a','c'])
s2
s2.index
1.3使用python字典创建Series
python字典和seires有着密不可分的关系
sdata='apple':35,'tex':40,'bananan':20,'pearl':30
s3=pd.Series(sdata)
s3
1.4根据标签索引查询数据
----类似pthon的字典dict
s2
s2['a']
查一个数据得到是python原生的数据类型
#查一个数据得到是python原生的数据类型
type(s2['a'])
s2[['b','a']]
查询Series的类型 type(s2[['b','a']])
#查询Series的类型
type(s2[['b','a']])
2.DataFrame
DataFrame是一个表格型的数据结构¶
①每列可以是不同的值类型(数值、字符串、布尔值等)
②既有行索引index,也有列索引columns
③可以被看做由Series组成的字典
④创建dataframe最常用的方法,见读取纯文本文件、excel、mysql数据库
2.1根据多个字典序列创建dataframe
列表中每个值的个数都必须相同
#列表中每个值都必须相同
data=
'state':['apple','tex','txt','banana','cxv'],
'year':[2000,1999,1998,1997,1996],
'pop':[1.1,1.2,1.3,1.4,1.5]
df=pd.DataFrame(data)
df
df.dtypes
df.columns
df.index
3.从DataFrame中查询出Series
如果只查询一列,一行,返回的是pd.Series
如果查询多行、多列,返回的是pd.DataFrame
df
3.1查询一列,结果是一个pd.Series
df['state']
type(df['year'])
3.2查询多列,结果是一个pd.DataFrame
df[['pop','year']]
type(df[['pop','year']])
3.3查询一行,结果是一个pd.Series
loc(1)代表查询一行
df.loc[1]
type(df.loc[1])
3.4查询多行,结果是一个pd.DataFrame
列表中切片的操作方法去取,但是在Pandas中包括末尾元素
#列表中切片的操作方法去取,但是在Pandas中包括末尾元素
df.loc[1:3]
type(df.loc[1:3])
总结:
以上是关于Pandas的DataFrame & Series详解的主要内容,如果未能解决你的问题,请参考以下文章
如何将 Python 列表转换为 pandas DataFrame :
SQLAlchemy ORM 转换为 pandas DataFrame