比较两列的熊猫数据框,如果不同,则使用正确的列之一

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了比较两列的熊猫数据框,如果不同,则使用正确的列之一相关的知识,希望对你有一定的参考价值。

有两个数据框,一个包含城市的ground_truth,另一个从其他文件中随机读取。

  ground_truth['cities'] = pd.DataFrame(['New York','Denvor','Cleveland'],columns = ['cities'])
  random_df =  pd.DataFrame(['DenvoR','cleveland'],columns = ['cities'])

需要比较两个数据帧,将random_df cities列与ground_truth cities列进行比较,如果情况混乱,请更改为ground_truth城市。到目前为止,我使用过循环,但效果不错。有什么建议吗?

答案

检查与

s1=df.cities.str.upper()
s2=random_df.cities.str.upper()
df.loc[s1.isin(s2),'cities']=s1.map(dict(zip(s2,random_df.cities)))
df
      cities
0   New York
1     DenvoR
2  cleveland

以上是关于比较两列的熊猫数据框,如果不同,则使用正确的列之一的主要内容,如果未能解决你的问题,请参考以下文章

熊猫数据框的索引目前是两列的“分组依据”,但我希望它们作为自己的列,并带有标准数字索引

确定熊猫数据框中的列值何时更改

熊猫数据框中的列的总和

重命名未命名的列熊猫数据框

来自两列的熊猫数据框类别代码

来自两列的熊猫数据框类别代码