Pandas处理数据中常用的命令及方法

Posted smarttony

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas处理数据中常用的命令及方法相关的知识,希望对你有一定的参考价值。

首先导入必要的包

import numpy as np
import pandas as pd

1,拉取数据

eg:l_sql = "select * from item_t"

     df = pd.read_sql(l_sql,conn,index_col=None)       #其中conn为数据库连接,index_col=None表示不从数据中产生index

 

2,重命名DataFrame的列名

df.rename(index=str,columns=‘MST01‘:‘Item‘,‘DAT‘:‘Date‘,‘MST08‘:‘Qty‘,‘BSUPPLY‘:‘Type‘,inplace=True)   #重命名df的指定列

 

3,选择DataFrame的数据

技术图片

技术图片

选择数据:df1=df.loc[df[‘Name‘]==‘Jack‘,:]   loc按照行号和列名进行选择数据,例子中表示选择Name为Jack的所有列

更新数据:df.loc[df[‘Name‘]==‘Jack‘,[‘YuWen‘]] = 70  表示更新Name为Jack,列名为‘YuWen’的数值为70

至于删除数据,直接可以选择出来,重新赋值一个DataFrame就可以了

4,重新定义index

df = df.reset_index() #可以重新定义index,并且把原先的index作为DataFrame的一列

5,数据的串联(SQL左右连接)

df6 = pd.merge(df4,df5,how=‘left‘,on=‘Item‘)

6,数据的拼接合并,如两份数据有相同的列名,需要合并,可以使用下面的命令            

df1.append(df2)




 

 

 

以上是关于Pandas处理数据中常用的命令及方法的主要内容,如果未能解决你的问题,请参考以下文章

pandas数据分析-常用命令

python时间处理模块datetime+dateutilnumpy时间处理模块datetime64以及pandas时间处理模块Timestamp的演化路径及常用处理接口

python常用包及主要功能

pandas学习(常用数学统计方法总结读取或保存数据缺省值和异常值处理)

Pandas时间类型数据处理常用方法小结

Pandas时间类型数据处理常用方法小结