计算熊猫单元格中字符串中的元素数

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算熊猫单元格中字符串中的元素数相关的知识,希望对你有一定的参考价值。

我的数据看起来像这样

>df
    Employee     Entries
0       A     abc,sed,yrs,sef
1       B       wes,det,fyd

我想计算“条目”列每行中有多少个单词。因此,第一行是4,第二行是3。

我尝试过

# Count Comma and add 1
df['Entries_Count'] = df.Entries.str.count(',')+1

那没关系,我有些行不是空的。

所以我如何计算每个单元格中的元素。另外,这不是列表,而是字符串。

答案

使用pandas.Series.str.splitstr.len

  Employee          Entries
0        A  abc,sed,yrs,sef
1        B      wes,det,fyd
2        C          oneword # Added for a demonstration
3        D              NaN # Added for a demonstration

df['Entries'].str.split(',').str.len()

或与pandas.Series.str.count一起使用regex

df['Entries'].str.count('\w+')

输出:

0    4.0
1    3.0
2    1.0
3    NaN
Name: Entries, dtype: float64

您可以添加sum以获得总数:

df['Entries'].str.split(',').str.len().sum()

输出:

8
另一答案

您能不能尝试以下操作。

df['Entries'].str.count(',').add(1).sum()

提供的样本输出将为7

以上是关于计算熊猫单元格中字符串中的元素数的主要内容,如果未能解决你的问题,请参考以下文章

根据“如果单元格中的字符串”条件删除熊猫列中的行

从熊猫数据框单元格中的凌乱字符串中删除换行符?

如何计算一行excel单元格中相同字符的出现次数

将熊猫数据框单元格中的字典解析为新行单元格(新列)

读取包含来自csv的单元格中的字典的熊猫数据框

列表追加到熊猫单元格中