DataFrame中统计某几列中字符出现次数并比较

Posted 2021-03-17 xiaodongsuibi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了DataFrame中统计某几列中字符出现次数并比较相关的知识，希望对你有一定的参考价值。

aa = pd.DataFrame({‘id‘:[‘xx‘,‘yy‘,‘zz‘,‘mm‘], ‘a‘:[‘10‘,‘10‘,‘11‘,np.nan],‘b‘:[‘11‘,‘12‘,‘11‘,np.nan],‘c‘:[‘10‘,‘12‘,‘‘,np.nan],‘d‘:[‘10‘,‘10‘,‘10‘,np.nan],‘e‘:[‘10‘,‘10‘,‘11‘,‘‘]})
aa

　技术图片　

def map_func1(x):
    if (x[‘a‘] == x[‘b‘] == x[‘c‘] == x[‘d‘] == ‘‘):
        return ‘www‘
    else:
        li = list(x[[‘a‘,‘b‘,‘c‘,‘d‘]])
        print(li)
        set1 = set(li)
        dict1 = {}
        for item in set1:
            dict1.update({item:li.count(item)})
        print(dict1)
        return max(dict1,key=dict1.get)

aa[‘xinlai‘] = aa.apply(map_func1,axis=1)  #axis控制按行还是按列

　　技术图片

以上是关于DataFrame中统计某几列中字符出现次数并比较的主要内容，如果未能解决你的问题，请参考以下文章

pandas提取DataFrame数据集中某几列

Spark dataframe 中某几列合并成vector或拆分

linux中统计文件中一个字符串出现的次数

计算数据框列中真/假的出现次数

计算数据框列中列表中单词的出现次数