根据条件替换不同文件中的字符串

Posted

技术标签:

【中文标题】根据条件替换不同文件中的字符串【英文标题】:Replace strings from different files according to condition 【发布时间】:2019-03-31 02:03:43 【问题描述】:

我是 Python 编码的新手,但遇到了有关 csv 文件数据操作的问题。

基本上,我有 2 个 csv 文件导入,这要归功于它们看起来像的 pd.read_csv

df1 which has 9 rows including headers and 5 columns

df2 which has 65 rows including headers and same 5 columns

我想用 df2 中关于 'NBIMAGE'句子替换 df1 中的句子,并保存第三个名为 df3 的 csv(或者只是将 df1 的修改版本保存为 df1 而没有新文件)

换句话说,只要 df1 中的'NBIMAGE' = df2 中的'NBIMAGE'(即使行不同),它应该将 df1 中该行的 SENTENCE 替换为 df2 中具有相同“NBIMAGE”的句子

我所做的是

df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

df1['newcolumn'] = 
np.where (df1['NBIMAGE'] == df2['NBIMAGE'], df2['SENTENCE'], 0) 

但它输出一个 ValueError: Can only compare identically-labeled Series objects

我不想使用替换,因为我需要指定要替换的内容,但我认为使用 numpy 处理字符串也不是最好的解决方案......

希望您能理解我的问题,并感谢大家的帮助!

【问题讨论】:

【参考方案1】:
df3 = df1.drop('SENTENCE',axis=1).merge(df2[['NBIMAGE','SENTENCE']],how='left', on='NBIMAGE')

【讨论】:

以上是关于根据条件替换不同文件中的字符串的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式:(1)要求提取字符串中的img标签,并根据不同的情况将该img标签替换成不同的字符串。

正则表达式查找字符串并替换它或根据条件添加额外字符

用来自不同文件的字符串替换文件中的字符串

1个函数独立替换4个不同ID的innerHTML

如何根据php文件中的名称替换.txt文件中的字符串?

条件字符串替换