熊猫用 min 函数填充列值

Posted

技术标签:

【中文标题】熊猫用 min 函数填充列值【英文标题】:pandas fill the column values with min function 【发布时间】:2021-10-04 13:56:42 【问题描述】:

我有一个包含 2 列的数据框,我需要添加第三列“开始”。但是我的代码由于某种原因不起作用,我不知道为什么。这是我的代码

df.loc[df.type=='C', 'start']= min(-1+df['dq']-3,4)
df.loc[df.type=='A', 'start']= min(-3+df['dq']-3,4)
df.loc[df.type=='B', 'start']= min(-3+df['dq']-5,4)

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), 
a.any() or a.all().

数据集如下所示:

type        dq
A            3
A            4
B            8
C            3

【问题讨论】:

预期输出是什么? 【参考方案1】:

由于您传递给min() 的第一个参数是一个系列,而第二个 (4) 是一个int,因此引发了错误。

由于您使用 min 将大于 4 的值替换为 4,因此您可以在最后使用 where 替换一次:

df.loc[df.type=='C', 'start'] = -1+df['dq']-3
df.loc[df.type=='A', 'start'] = -3+df['dq']-3
df.loc[df.type=='B', 'start'] = -3+df['dq']-5
df["start"] = df["start"].where(df["start"]<4,other=4)

>>> df
  type  dq  start
0    A   3     -3
1    A   4     -2
2    B   8      0
3    C   3     -1

获取专栏的另一种(可能更简洁)方法是使用numpy.select,如下所示:

import numpy as np

df["start"] = np.select([df["type"]=="A", df["type"]=="B", df["type"]=="C"],
                        [df['dq']-6, df["dq"]-8, df["dq"]-4])
df["start"] = df["start"].where(df["start"]<4, 4)

【讨论】:

【参考方案2】:

您不能使用带最小值的系列。相反,您可以这样做:

s = (df['dq'] - df['type'].map('A': 6, 'B': 8, 'C': 4))
df['start'] = s.where(s<4, 4)

输出:

  type  dq  start
0    A   3     -3
1    A   4     -2
2    B   8      0
3    C   3     -1

【讨论】:

以上是关于熊猫用 min 函数填充列值的主要内容,如果未能解决你的问题,请参考以下文章

熊猫:用列值匹配的列表填充新列

熊猫填充列值以具有其他列的相似值

从多个字典填充熊猫数据框

熊猫合并用空值填充新数据框

SQL - 根据条件填充列值

SQL - 在填充另一列时继承派生列值