使用索引设置 Pandas 列的字符串值

Posted

技术标签:

【中文标题】使用索引设置 Pandas 列的字符串值【英文标题】:Setting String Values of a Pandas Column with Indices 【发布时间】:2020-12-05 21:42:53 【问题描述】:

我正在尝试在我的数据框中生成一个新列,其中为不同的索引值分配了一个字符串。我不够熟练,无法使用循环来完成,所以我尝试了子集和索引,看看是否可以让我的生活更轻松。

df['event_type'] = []

A = df[df['flags'].isin(['A'])].index
B= df[df['flags'].isin(['B'])].index
C = df[df['flags'].isin(['B'])].index


df.loc[A, 'event_type'] = 'Condition One'
df.loc[B, 'event_type'] = 'Condition Two'
df.loc[C, 'event_type'] = 'Condition Three'

我已经多次得到值的长度与索引的长度不匹配,并且 Index.name 必须是可散列类型错误好几次了。我只想将这些字符串分配给新列中的这些索引,列中的所有其他值都可以是 Nan。

【问题讨论】:

【参考方案1】:

你可以使用Series.map

df['event_type'] = df.flags.fillna('').map(
    "A": "Condition One", "B": "Condition Two", "C": "Condition Three"
)

【讨论】:

以上是关于使用索引设置 Pandas 列的字符串值的主要内容,如果未能解决你的问题,请参考以下文章

Pandas处理dataframe的文本数据列:使用str属性获取数据列的字符串方法类使用方括号索引根据起始索引和结束索引抽取字符串内容的子字符串(左闭右开区间)

Pandas处理dataframe的文本数据列:使用str属性获取数据列的字符串方法类使用方括号索引根据起始索引抽取字符串内容的子字符串(如果只有一个数字默认索引到字符串结束)

Pandas处理dataframe的文本数据列:使用str属性获取数据列的字符串方法类使用方括号索引根据起始索引抽取字符串内容的子字符串(如果只有一个数字默认索引到字符串结束)

Pandas处理dataframe的文本数据列:使用str属性获取数据列的字符串方法类使用方括号索引根据起始索引和结束索引抽取字符串内容的子字符串(左闭右开区间-1代表最后一个索引位置)

pandas使用read_csv函数读取文件时指定数据列的数据类型pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串

Pandas处理dataframe的文本数据列:使用str属性获取数据列的字符串方法类slice函数根据起始索引和结束索引抽取字符串内容的子字符串(左闭右开区间)