pandas dataframe 数据框

Posted akinghuang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas dataframe 数据框相关的知识,希望对你有一定的参考价值。

数据框是一个二维数据结构,类似于SQL中的表格。借助字典,数组,列表和序列等可以构造数据框。

1.字典创建数据框,则列的名称为key的名称:

d = {one:pd.Series([1,2,3],index= [a,b,c]),
     two:pd.Series([1,2,3,4],index=[a,b,c,d])
}
print(pd.DataFrame(d))

2.列表创建数据框:

d = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=[V1,V2,V3,V4])
print(d)

3.列的选取,删除和增加:

df = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=[V1,V2,V3,V4])
print(df,
)

df[V5] = df[V1]*df[V2] #第一列与第二列相乘;
print(第一列与第二列相乘:)
print(df[V5],
)

df[Flag] = df[V2] > 20 #增加一列;逻辑结果的值赋给flag
print(增加一列:)
print(df,
)


del df[Flag] #删除列
V5 = df.pop(V5) #删除列
print(删除列:)
print(df,
,V5,
)


df.insert(2,V6,df[V1]) # 2为插入的位置,V6为列的名称,df[‘V1‘]为插入的数值
print(插入列:)
print(df,
)
print(**50)

4.一般的选取方式:

 

操作方式 方法 结果
选择某一列 def[col] 序列
通过列标签选择某一行 df.loc[col] 序列
通过具体的位置选择某一行 df.icol[2] 序列
切行 df[5:10] 数据框
读取其中一行数据

df.loc[0,:]
df.iloc[0,:]
df.ix[0,:]

 


以上是关于pandas dataframe 数据框的主要内容,如果未能解决你的问题,请参考以下文章

Python - Pandas Dataframe 以正确的方式合并两个数据框

pandas dataframe 数据框

从 Pandas Dataframe 错误创建 Spark DataFrame

Pandas:如何测试 top-n-dataframe 是不是真的来自原始数据框

如何将方法应用于 Pandas Dataframe [重复]

使用 numpy 数组中的值从 DataFrame 创建 Pandas DataFrame 以访问数据框索引