比较两列的熊猫数据框,如果不同,则使用正确的列之一
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了比较两列的熊猫数据框,如果不同,则使用正确的列之一相关的知识,希望对你有一定的参考价值。
有两个数据框,一个包含城市的ground_truth,另一个从其他文件中随机读取。
ground_truth['cities'] = pd.DataFrame(['New York','Denvor','Cleveland'],columns = ['cities'])
random_df = pd.DataFrame(['DenvoR','cleveland'],columns = ['cities'])
需要比较两个数据帧,将random_df cities
列与ground_truth cities
列进行比较,如果情况混乱,请更改为ground_truth城市。到目前为止,我使用过循环,但效果不错。有什么建议吗?
答案
检查与
s1=df.cities.str.upper()
s2=random_df.cities.str.upper()
df.loc[s1.isin(s2),'cities']=s1.map(dict(zip(s2,random_df.cities)))
df
cities
0 New York
1 DenvoR
2 cleveland
以上是关于比较两列的熊猫数据框,如果不同,则使用正确的列之一的主要内容,如果未能解决你的问题,请参考以下文章