计算熊猫单元格中字符串中的元素数
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算熊猫单元格中字符串中的元素数相关的知识,希望对你有一定的参考价值。
我的数据看起来像这样
>df
Employee Entries
0 A abc,sed,yrs,sef
1 B wes,det,fyd
我想计算“条目”列每行中有多少个单词。因此,第一行是4,第二行是3。
我尝试过
# Count Comma and add 1
df['Entries_Count'] = df.Entries.str.count(',')+1
那没关系,我有些行不是空的。
所以我如何计算每个单元格中的元素。另外,这不是列表,而是字符串。
答案
使用pandas.Series.str.split
和str.len
:
Employee Entries
0 A abc,sed,yrs,sef
1 B wes,det,fyd
2 C oneword # Added for a demonstration
3 D NaN # Added for a demonstration
df['Entries'].str.split(',').str.len()
或与pandas.Series.str.count
一起使用regex
:
df['Entries'].str.count('\w+')
输出:
0 4.0
1 3.0
2 1.0
3 NaN
Name: Entries, dtype: float64
您可以添加sum
以获得总数:
df['Entries'].str.split(',').str.len().sum()
输出:
8
另一答案
您能不能尝试以下操作。
df['Entries'].str.count(',').add(1).sum()
提供的样本输出将为7
。
以上是关于计算熊猫单元格中字符串中的元素数的主要内容,如果未能解决你的问题,请参考以下文章