Pandas处理数据中常用的命令及方法
Posted smarttony
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas处理数据中常用的命令及方法相关的知识,希望对你有一定的参考价值。
首先导入必要的包
import numpy as np
import pandas as pd
1,拉取数据
eg:l_sql = "select * from item_t"
df = pd.read_sql(l_sql,conn,index_col=None) #其中conn为数据库连接,index_col=None表示不从数据中产生index
2,重命名DataFrame的列名
df.rename(index=str,columns=‘MST01‘:‘Item‘,‘DAT‘:‘Date‘,‘MST08‘:‘Qty‘,‘BSUPPLY‘:‘Type‘,inplace=True) #重命名df的指定列
3,选择DataFrame的数据
选择数据:df1=df.loc[df[‘Name‘]==‘Jack‘,:] loc按照行号和列名进行选择数据,例子中表示选择Name为Jack的所有列
更新数据:df.loc[df[‘Name‘]==‘Jack‘,[‘YuWen‘]] = 70 表示更新Name为Jack,列名为‘YuWen’的数值为70
至于删除数据,直接可以选择出来,重新赋值一个DataFrame就可以了
4,重新定义index
df = df.reset_index() #可以重新定义index,并且把原先的index作为DataFrame的一列
5,数据的串联(SQL左右连接)
df6 = pd.merge(df4,df5,how=‘left‘,on=‘Item‘)
6,数据的拼接合并,如两份数据有相同的列名,需要合并,可以使用下面的命令
df1.append(df2)
以上是关于Pandas处理数据中常用的命令及方法的主要内容,如果未能解决你的问题,请参考以下文章
python时间处理模块datetime+dateutilnumpy时间处理模块datetime64以及pandas时间处理模块Timestamp的演化路径及常用处理接口