Pandas - 使用空格

Posted

技术标签:

【中文标题】Pandas - 使用空格【英文标题】:Pandas - Working with blank spaces 【发布时间】:2018-08-08 10:19:30 【问题描述】:

我有一个如下的数据框,它有 3 列,即 id、name 和 feedback。 customer_input 的值之一具有如下值

id,name,feedback
201,Robert,"response time is slow
"

由于反馈列中包含的长文本,我在将这些数据插入数据库表时遇到问题。引号内的整个文本是一个单元格的值。如何删除下一行中的单词 slow 和右引号 (") 之间的所有多余空格 谁能建议我如何处理这些数据。

我正在使用 Amazon Redshift 表

【问题讨论】:

【参考方案1】:

你可以使用简单的str.replace

df['feedback'] = df['feedback'].str.replace('\r','')

df['feedback'] = df['feedback'].str.replace('\n','')
print(df)
201  Robert  response time is slow

【讨论】:

【参考方案2】:

要删除所有地方的空格,您可以在Python pandas 中执行以下操作。

df.columns = df.columns.str.replace(' ', '')

有关各种排列组合的更多详细信息,请参阅以下链接。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.replace.html#pandas.DataFrame.replace

Removing space from dataframe columns in pandas

【讨论】:

以上是关于Pandas - 使用空格的主要内容,如果未能解决你的问题,请参考以下文章

使用 pandas 的 df.to_csv 方法不适用于空格作为分隔符

从空格分隔的 .dat 文件中获取日期时间 - python/pandas [重复]

Pandas 列访问,列名包含空格

Pandas:取消组合并融化空格缩进的记录

无法从带有Pandas的CSV标头中删除空格

使用 pandas.read_csv 读取带有空格的 CSV 文件作为千位分隔符