Pandas - 使用空格

Posted

技术标签:

【中文标题】Pandas - 使用空格【英文标题】:Pandas - Working with blank spaces 【发布时间】:2018-08-08 10:19:30 【问题描述】:

我有一个如下的数据框,它有 3 列,即 id、name 和 feedback。 customer_input 的值之一具有如下值

id,name,feedback
201,Robert,"response time is slow
"

由于反馈列中包含的长文本,我在将这些数据插入数据库表时遇到问题。引号内的整个文本是一个单元格的值。如何删除下一行中的单词 slow 和右引号 (") 之间的所有多余空格 谁能建议我如何处理这些数据。

我正在使用 Amazon Redshift 表

【问题讨论】:

【参考方案1】:

你可以使用简单的str.replace

df['feedback'] = df['feedback'].str.replace('\r','')

df['feedback'] = df['feedback'].str.replace('\n','')
print(df)
201  Robert  response time is slow

【讨论】:

【参考方案2】:

要删除所有地方的空格,您可以在Python pandas 中执行以下操作。

df.columns = df.columns.str.replace(' ', '')

有关各种排列组合的更多详细信息,请参阅以下链接。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.replace.html#pandas.DataFrame.replace

Removing space from dataframe columns in pandas

【讨论】:

以上是关于Pandas - 使用空格的主要内容,如果未能解决你的问题,请参考以下文章