删除字符串中的所有空格

Posted

技术标签:

【中文标题】删除字符串中的所有空格【英文标题】:Remove all whitespace in a string 【发布时间】:2012-01-06 09:24:37 【问题描述】:

我想从字符串的两端以及单词之间消除所有空格。

我有这个 Python 代码:

def my_handle(self):
    sentence = ' hello  apple  '
    sentence.strip()

但这只会消除字符串两侧的空格。如何删除所有空格?

【问题讨论】:

您的结果应该是什么样的? hello apple? helloapple? @JoachimPileborg,不完全是我的想法,因为它也是关于减少单词之间的空格。 如果有错误请纠正我,但“空白”不是“空格字符”的同义词。当前标记为正确的答案不会删除所有whitespace。但是,既然它被标记为正确,它一定已经回答了预期的问题?所以我们应该编辑问题以反映接受的答案? @Kalanamith 是否要删除所有空格或仅删除空格? 【参考方案1】:

我使用 split() 忽略所有空格并使用 join() 连接 字符串。

sentence = ''.join(' hello  apple  '.split())
print(sentence) #=> 'helloapple'

我更喜欢这种方法,因为它只是一个表达式(不是语句)。 它易于使用,无需绑定变量即可使用。

print(''.join(' hello  apple  '.split())) # no need to binding to a variable

【讨论】:

【参考方案2】:

试试这个.. 而不是使用 re 我认为使用 split with strip 会更好

def my_handle(self):
    sentence = ' hello  apple  '
    ' '.join(x.strip() for x in sentence.split())
#hello apple
    ''.join(x.strip() for x in sentence.split())
#helloapple

【讨论】:

【参考方案3】:

“空白”包括空格、制表符和 CRLF。所以我们可以使用的一个优雅的one-liner字符串函数是str.translate:

Python 3

' hello  apple '.translate(str.maketrans('', '', ' \n\t\r'))

或者如果你想彻底:

import string
' hello  apple'.translate(str.maketrans('', '', string.whitespace))

Python 2

' hello  apple'.translate(None, ' \n\t\r')

或者如果你想彻底:

import string
' hello  apple'.translate(None, string.whitespace)

【讨论】:

这对像\xc2\xa0这样的Unicode空格没有帮助 ans.translate( None, string.whitespace ) 只为我生成 builtins.TypeError: translate() takes exactly one argument (2 given)。 Docs 说这个参数是一个翻译表,见 string.maketrans()。但请参阅下面 Amnon Harel 的评论。 ' hello apple'.translate(str.maketrans('', '', string.whitespace)) 注意:如果您打算多次执行此操作,最好创建一个变量来存储转换表。【参考方案4】:

从字符串的两端和单词之间消除所有空格。

>>> import re
>>> re.sub("\s+", # one or more repetition of whitespace
    '', # replace with empty string (->remove)
    ''' hello
...    apple
... ''')
'helloapple'
https://en.wikipedia.org/wiki/Whitespace_character

Python 文档:

https://docs.python.org/library/stdtypes.html#textseq https://docs.python.org/library/stdtypes.html#str.replace https://docs.python.org/library/string.html#string.replace https://docs.python.org/library/re.html#re.sub https://docs.python.org/library/re.html#regular-expression-syntax

【讨论】:

我知道re 之前有人建议过,但我发现问题标题的实际答案在所有其他选项中有点隐藏。【参考方案5】:
' hello  \n\tapple'.translate(ord(c):None for c in ' \n\t\r')

MaK 已经指出了上面的“翻译”方法。这种变体适用于 Python 3(请参阅 this Q&A)。

【讨论】:

谢谢!或者,xxx.translate( ord(c) :None for c in string.whitespace ) 以确保彻底性。【参考方案6】:

如果要删除前导和结尾空格,请使用str.strip()

sentence = ' hello  apple'
sentence.strip()
>>> 'hello  apple'

如果要删除所有空格字符,请使用str.replace()

(注意,这只会删除“正常”的 ASCII 空格字符 ' ' U+0020,但不会删除 any other whitespace)

sentence = ' hello  apple'
sentence.replace(" ", "")
>>> 'helloapple'

如果要删除重复的空格,请使用str.split()

sentence = ' hello  apple'
" ".join(sentence.split())
>>> 'hello apple'

【讨论】:

这个功能的伟大之处在于它还从我从 Beautiful Soup 收到的 html 文件中删除了 '\r\n'。 我喜欢 "".join(sentence.split()),这会删除句子中任何地方的所有空格(空格、制表符、换行符)。 这里是初学者。有人能解释一下为什么 print(sentence.join(sentence.split())) 结果是“你好你好苹果”吗?只是想了解这里的代码是如何处理的。 "".join(sentence.split()) 确实是规范的解决方案,有效地删除 all 空格而不仅仅是空格。 Mark Byers' excellent answer 可能应该被接受来代替这个不太适用的答案。【参考方案7】:

另一种方法是使用正则表达式并匹配these strange white-space characters。以下是一些示例:

删除字符串中的所有空格,甚至是单词之间的空格:

import re
sentence = re.sub(r"\s+", "", sentence, flags=re.UNICODE)

删除字符串开头的空格:

import re
sentence = re.sub(r"^\s+", "", sentence, flags=re.UNICODE)

删除字符串 END 中的空格:

import re
sentence = re.sub(r"\s+$", "", sentence, flags=re.UNICODE)

删除字符串开头和结尾的空格:

import re
sentence = re.sub("^\s+|\s+$", "", sentence, flags=re.UNICODE)

仅删除重复的空格:

import re
sentence = " ".join(re.split("\s+", sentence, flags=re.UNICODE))

(所有示例都适用于 Python 2 和 Python 3)

【讨论】:

不适用于“\u202a1234\u202c”。给出相同的输出: u'\u202a1234\u202c' @Sarang:那些不是空白字符(谷歌它们,你会看到),而是“一般标点符号”。我的回答只涉及删除归类为空格的字符。 这是我在这里看到的唯一解决方案,可以删除那些讨厌的 unicode 空白字符,感谢 fam【参考方案8】:

另外,strip 有一些变化:

删除字符串开头和结尾的空格:

sentence= sentence.strip()

删除字符串开头的空格:

sentence = sentence.lstrip()

删除字符串 END 中的空格:

sentence= sentence.rstrip()

striplstriprstrip 三个字符串函数都可以带参数进行剥离,默认为全空格。这在您处理特定内容时会很有帮助,例如,您可以只删除空格但不能删除换行符:

" 1. Step 1\n".strip(" ")

或者您可以在读取字符串列表时删除多余的逗号:

"1,2,3,".strip(",")

【讨论】:

【参考方案9】:

小心:

strip 执行 rstrip 和 lstrip(删除前导和尾随空格、制表符、回车和换页符,但不会删除字符串中间的它们)。

如果您只替换空格和制表符,您最终可能会得到隐藏的 CRLF,这些 CRLF 看起来与您要查找的内容相匹配,但并不相同。

【讨论】:

虽然这是一个很好的观点,但这并不是真正的答案,除非您提供解决方案,否则应该作为评论。您是否愿意为此提供解决方案,这正是我正在寻找的?干杯【参考方案10】:
import re    
sentence = ' hello  apple'
re.sub(' ','',sentence) #helloworld (remove all spaces)
re.sub('  ',' ',sentence) #hello world (remove double spaces)

【讨论】:

问题是删除所有空格,包括制表符和换行符,这个 sn-p 只会删除常规空格。【参考方案11】:

要删除仅空格,请使用str.replace:

sentence = sentence.replace(' ', '')

要删除所有空白字符(空格、制表符、换行符等),您可以使用split 然后join

sentence = ''.join(sentence.split())

或正则表达式:

import re
pattern = re.compile(r'\s+')
sentence = re.sub(pattern, '', sentence)

如果您只想从开头和结尾删除空格,可以使用strip

sentence = sentence.strip()

您还可以使用lstrip 仅删除字符串开头的空格,使用rstrip 删除字符串末尾的空格。

【讨论】:

注意:不需要编译步骤,re.sub(和朋友)缓存编译后的模式。另请参阅Emil's answer。 python3: yourstr.translate(str.maketrans('', '', ' \n\t\r'))【参考方案12】:

要从开头和结尾删除空格,请使用strip

>> "  foo bar   ".strip()
"foo bar"

【讨论】:

该问题专门要求删除所有空格,而不仅仅是在末尾。请注意。 这个答案与这个问题无关

以上是关于删除字符串中的所有空格的主要内容,如果未能解决你的问题,请参考以下文章

如何从PHP和Javascript中的字符串中删除所有空格[重复]

删除所有空格并将多行合并为 SQL 中的单行

JavaScript:如何从 JSON 字符串中删除除值中的空格之外的所有空格?

如何删除字符串中的所有空格和 n r?

pandas使用strip函数将dataframe所有数据列名称中的空格(空格回车符制表符)字符删除

从 Python3.3 中的字符串中删除除字母和空格之外的所有内容