如何在panda中对行和多列进行迭代?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在panda中对行和多列进行迭代?相关的知识,希望对你有一定的参考价值。
我有一个数据框(df1),我想替换V2和V3列的值,如果它们的值与V1相同。
import pandas as pd
import numpy as np
df_start= pd.DataFrame({"ID":[1, 2 , 3 ,4, 5], "V1":[10,5,15,20,20], "V2":[10,5,20,17,15], "V3":[10, 25, 15, 10, 20]})
df_end = pd.DataFrame({"ID":[1, 2 , 3 ,4, 5], "V1":[10,5,15,20,20], "V2":[np.nan,np.nan,20,17,15], "V3":[np.nan, 25, np.nan, 10, np.nan]})
我知道不推荐使用iterrows,但我不知道我应该怎么做。
答案
你可以使用 mask
:
对于一个单独的数据框架,请使用 assign
:
df_end = df_start.assign(**df_start[['V2','V3']]
.mask(df_start[['V2','V3']].eq(df_start['V1'],axis=0)))
对于修改输入的数据框架,只需原地赋值即可。
df_start[['V2','V3']] = (df_start[['V2','V3']]
.mask(df_start[['V2','V3']].eq(df_start['V1'],axis=0)))
ID V1 V2 V3
0 1 10 NaN NaN
1 2 5 NaN 25.0
2 3 15 20.0 NaN
3 4 20 17.0 10.0
4 5 20 15.0 NaN
另一答案
你仍然会使用一个常规的循环来检查各列,但是apply函数是你最好的朋友,可以进行这种面向行的操作。如果你要使用来自多个列的信息(这里你要比较一些列和 "V1"),你可以在DataFrame上使用apply函数并指定轴。如果你只想看一列的信息(比如做一个列,如果它们是偶数,就把V1的值翻倍,你可以只用一个Series来应用。
对于这两个版本的函数,你要传递的参数是一个lambda表达式。如果你应用它做一个DataFrame,就像你在这里一样。x
代表行中的值,这些值可以被列索引。最后,你将结果赋值回DataFrame中的一个新的或现有的列。
假设df_start和df_end代表你计划的输入和输出。
cols = ["V2","V3"]
for col in cols:
df_start[col] = df.apply(lambda x[col] if x[col] != x["V1"] else np.nan, axis=1]
以上是关于如何在panda中对行和多列进行迭代?的主要内容,如果未能解决你的问题,请参考以下文章
如何在 pct_change 计算中对 pandas DataFrame 中的多列进行分组