5 Dataframe的函数应用
Posted lhjc
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了5 Dataframe的函数应用相关的知识,希望对你有一定的参考价值。
def adder(ele1,ele2): return ele1+ele2
5.1 df 每个元素均变换
df = pd.DataFrame(np.random.randn(5,3),columns=[‘col1‘,‘col2‘,‘col3‘]) df.pipe(adder,2)#对df中的每一个元素依次和2传入函数adder,返回新数据框,但原df不变
5.2 对所有行(列)进行变换
### 行变换或列变换 df.apply(np.mean)#将df的每一列进行mean,对列操作为默认项 df.apply(np.mean,axis=1)#axis=1 表示对行操作 df.apply(lambda x:x.max()-x.min()) df.apply(lambda x:sum(x)) #lambda表示用户自定义函数
5.3 对单个行(列)进行变换
### 单个列的变换 df[‘col1‘].map(lambda x:x*100) df[‘col1‘].apply(lambda x:x*100)#apply和map可以通用 df.applymap(lambda x:x*100) df.pipe(lambda x:x*100) df.apply(lambda x:x*100)#三种方式等价
5.4 对单个元素进行变换
### 单个元素的变换 df.iloc[1,1]=df.iloc[1,1]*100
以上是关于5 Dataframe的函数应用的主要内容,如果未能解决你的问题,请参考以下文章
Pandas Dataframe Performance 应用函数与 shift
pandas GroupBy上的方法apply:一般性的“拆分-应用-合并”
pandas计算dataframe结束时间列和起始时间列的时间差使用nlargest函数获取dataframe数据时间差前5大的样本数据