pandas dataframe 数据框
Posted akinghuang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas dataframe 数据框相关的知识,希望对你有一定的参考价值。
数据框是一个二维数据结构,类似于SQL中的表格。借助字典,数组,列表和序列等可以构造数据框。
1.字典创建数据框,则列的名称为key的名称:
d = {‘one‘:pd.Series([1,2,3],index= [‘a‘,‘b‘,‘c‘]), ‘two‘:pd.Series([1,2,3,4],index=[‘a‘,‘b‘,‘c‘,‘d‘]) } print(pd.DataFrame(d))
2.列表创建数据框:
d = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=[‘V1‘,‘V2‘,‘V3‘,‘V4‘]) print(d)
3.列的选取,删除和增加:
df = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=[‘V1‘,‘V2‘,‘V3‘,‘V4‘]) print(df,‘ ‘) df[‘V5‘] = df[‘V1‘]*df[‘V2‘] #第一列与第二列相乘; print(‘第一列与第二列相乘:‘) print(df[‘V5‘],‘ ‘) df[‘Flag‘] = df[‘V2‘] > 20 #增加一列;逻辑结果的值赋给flag print(‘增加一列:‘) print(df,‘ ‘) del df[‘Flag‘] #删除列 V5 = df.pop(‘V5‘) #删除列 print(‘删除列:‘) print(df,‘ ‘,V5,‘ ‘) df.insert(2,‘V6‘,df[‘V1‘]) # 2为插入的位置,V6为列的名称,df[‘V1‘]为插入的数值 print(‘插入列:‘) print(df,‘ ‘) print(‘*‘*50)
4.一般的选取方式:
操作方式 | 方法 | 结果 |
选择某一列 | def[col] | 序列 |
通过列标签选择某一行 | df.loc[col] | 序列 |
通过具体的位置选择某一行 | df.icol[2] | 序列 |
切行 | df[5:10] | 数据框 |
读取其中一行数据 |
df.loc[0,:] |
以上是关于pandas dataframe 数据框的主要内容,如果未能解决你的问题,请参考以下文章
Python - Pandas Dataframe 以正确的方式合并两个数据框
从 Pandas Dataframe 错误创建 Spark DataFrame
Pandas:如何测试 top-n-dataframe 是不是真的来自原始数据框