将多列作为参数传递给函数,并从函数中为python中的数据框获取新列
Posted
技术标签:
【中文标题】将多列作为参数传递给函数,并从函数中为python中的数据框获取新列【英文标题】:Passing multiple columns to a function as argument and getting a new column from the function for the dataframe in python 【发布时间】:2021-10-04 00:02:41 【问题描述】:我想通过需要两列作为参数的函数的返回值创建一个新列。
这是我的数据框(df)。数据框有多列索引
Time | Temp | Press |
---|---|---|
sec | K | kPa |
0.00 | 300 | 101 |
.... | .... | .... |
4.00 | 380 | 180 |
我有一个函数从 Temp and Press 返回一个新值
def density(Temp, Press)
....
return rho
使用此功能,我想创建一个新列,如下所示
Time | Temp | Press | Density |
---|---|---|---|
sec | K | kPa | kg/m3 |
0.00 | 300 | 101 | 1000 |
.... | .... | .... | .... |
4.00 | 380 | 180 | 1004 |
从我自己的搜索来看,我似乎需要使用'apply'。
所以我尝试了一些代码,例如
df['Density', 'kg/m3'] = df['Density', 'kg/m3'].apply(density, args=(df['Temp', 'K'], df['Press','kPa']))
我收到了错误消息
TypeError: 'module' 对象不可调用
从QnA 开始,我猜应该修改函数定义以将数据帧类型作为参数。但我被困在这里了。
如果我使用另一种方法,例如for-iteration,它将得到解决。但我希望这个问题有一个更快更简洁的表达方式。
有解决办法吗?
我提前感谢它。 =)
【问题讨论】:
【参考方案1】:下面的代码可以运行很长时间,并且无论如何都会产生结果
df['Density', 'kg/m3'] = df.apply(lambda x:density(x['Temp', 'K'], x['Press','kPa']), axis=1)
“数据”很大(ASCII,22 Mb),但我想知道是否有办法加速计算。
【讨论】:
以上是关于将多列作为参数传递给函数,并从函数中为python中的数据框获取新列的主要内容,如果未能解决你的问题,请参考以下文章