删除字符串中的所有空格
Posted
技术标签:
【中文标题】删除字符串中的所有空格【英文标题】:Remove all whitespace in a string 【发布时间】:2012-01-06 09:24:37 【问题描述】:我想从字符串的两端以及单词之间消除所有空格。
我有这个 Python 代码:
def my_handle(self):
sentence = ' hello apple '
sentence.strip()
但这只会消除字符串两侧的空格。如何删除所有空格?
【问题讨论】:
您的结果应该是什么样的?hello apple
? helloapple
?
@JoachimPileborg,不完全是我的想法,因为它也是关于减少单词之间的空格。
如果有错误请纠正我,但“空白”不是“空格字符”的同义词。当前标记为正确的答案不会删除所有whitespace。但是,既然它被标记为正确,它一定已经回答了预期的问题?所以我们应该编辑问题以反映接受的答案? @Kalanamith 是否要删除所有空格或仅删除空格?
【参考方案1】:
我使用 split() 忽略所有空格并使用 join() 连接 字符串。
sentence = ''.join(' hello apple '.split())
print(sentence) #=> 'helloapple'
我更喜欢这种方法,因为它只是一个表达式(不是语句)。 它易于使用,无需绑定变量即可使用。
print(''.join(' hello apple '.split())) # no need to binding to a variable
【讨论】:
【参考方案2】:试试这个.. 而不是使用 re 我认为使用 split with strip 会更好
def my_handle(self):
sentence = ' hello apple '
' '.join(x.strip() for x in sentence.split())
#hello apple
''.join(x.strip() for x in sentence.split())
#helloapple
【讨论】:
【参考方案3】:“空白”包括空格、制表符和 CRLF。所以我们可以使用的一个优雅的one-liner字符串函数是str.translate
:
Python 3
' hello apple '.translate(str.maketrans('', '', ' \n\t\r'))
或者如果你想彻底:
import string
' hello apple'.translate(str.maketrans('', '', string.whitespace))
Python 2
' hello apple'.translate(None, ' \n\t\r')
或者如果你想彻底:
import string
' hello apple'.translate(None, string.whitespace)
【讨论】:
这对像\xc2\xa0
这样的Unicode空格没有帮助
ans.translate( None, string.whitespace )
只为我生成 builtins.TypeError: translate() takes exactly one argument (2 given)
。 Docs 说这个参数是一个翻译表,见 string.maketrans()。但请参阅下面 Amnon Harel 的评论。
' hello apple'.translate(str.maketrans('', '', string.whitespace))
注意:如果您打算多次执行此操作,最好创建一个变量来存储转换表。【参考方案4】:
从字符串的两端和单词之间消除所有空格。
>>> import re
>>> re.sub("\s+", # one or more repetition of whitespace
'', # replace with empty string (->remove)
''' hello
... apple
... ''')
'helloapple'
https://en.wikipedia.org/wiki/Whitespace_character
Python 文档:
https://docs.python.org/library/stdtypes.html#textseq https://docs.python.org/library/stdtypes.html#str.replace https://docs.python.org/library/string.html#string.replace https://docs.python.org/library/re.html#re.sub https://docs.python.org/library/re.html#regular-expression-syntax【讨论】:
我知道re
之前有人建议过,但我发现问题标题的实际答案在所有其他选项中有点隐藏。【参考方案5】:
' hello \n\tapple'.translate(ord(c):None for c in ' \n\t\r')
MaK 已经指出了上面的“翻译”方法。这种变体适用于 Python 3(请参阅 this Q&A)。
【讨论】:
谢谢!或者,xxx.translate( ord(c) :None for c in string.whitespace )
以确保彻底性。【参考方案6】:
如果要删除前导和结尾空格,请使用str.strip()
:
sentence = ' hello apple'
sentence.strip()
>>> 'hello apple'
如果要删除所有空格字符,请使用str.replace()
:
(注意,这只会删除“正常”的 ASCII 空格字符 ' ' U+0020
,但不会删除 any other whitespace)
sentence = ' hello apple'
sentence.replace(" ", "")
>>> 'helloapple'
如果要删除重复的空格,请使用str.split()
:
sentence = ' hello apple'
" ".join(sentence.split())
>>> 'hello apple'
【讨论】:
这个功能的伟大之处在于它还从我从 Beautiful Soup 收到的 html 文件中删除了 '\r\n'。 我喜欢 "".join(sentence.split()),这会删除句子中任何地方的所有空格(空格、制表符、换行符)。 这里是初学者。有人能解释一下为什么 print(sentence.join(sentence.split())) 结果是“你好你好苹果”吗?只是想了解这里的代码是如何处理的。"".join(sentence.split())
确实是规范的解决方案,有效地删除 all 空格而不仅仅是空格。 Mark Byers' excellent answer 可能应该被接受来代替这个不太适用的答案。【参考方案7】:
另一种方法是使用正则表达式并匹配these strange white-space characters。以下是一些示例:
删除字符串中的所有空格,甚至是单词之间的空格:
import re
sentence = re.sub(r"\s+", "", sentence, flags=re.UNICODE)
删除字符串开头的空格:
import re
sentence = re.sub(r"^\s+", "", sentence, flags=re.UNICODE)
删除字符串 END 中的空格:
import re
sentence = re.sub(r"\s+$", "", sentence, flags=re.UNICODE)
删除字符串开头和结尾的空格:
import re
sentence = re.sub("^\s+|\s+$", "", sentence, flags=re.UNICODE)
仅删除重复的空格:
import re
sentence = " ".join(re.split("\s+", sentence, flags=re.UNICODE))
(所有示例都适用于 Python 2 和 Python 3)
【讨论】:
不适用于“\u202a1234\u202c”。给出相同的输出: u'\u202a1234\u202c' @Sarang:那些不是空白字符(谷歌它们,你会看到),而是“一般标点符号”。我的回答只涉及删除归类为空格的字符。 这是我在这里看到的唯一解决方案,可以删除那些讨厌的 unicode 空白字符,感谢 fam【参考方案8】:另外,strip 有一些变化:
删除字符串开头和结尾的空格:
sentence= sentence.strip()
删除字符串开头的空格:
sentence = sentence.lstrip()
删除字符串 END 中的空格:
sentence= sentence.rstrip()
strip
lstrip
和rstrip
三个字符串函数都可以带参数进行剥离,默认为全空格。这在您处理特定内容时会很有帮助,例如,您可以只删除空格但不能删除换行符:
" 1. Step 1\n".strip(" ")
或者您可以在读取字符串列表时删除多余的逗号:
"1,2,3,".strip(",")
【讨论】:
【参考方案9】:小心:
strip
执行 rstrip 和 lstrip(删除前导和尾随空格、制表符、回车和换页符,但不会删除字符串中间的它们)。
如果您只替换空格和制表符,您最终可能会得到隐藏的 CRLF,这些 CRLF 看起来与您要查找的内容相匹配,但并不相同。
【讨论】:
虽然这是一个很好的观点,但这并不是真正的答案,除非您提供解决方案,否则应该作为评论。您是否愿意为此提供解决方案,这正是我正在寻找的?干杯【参考方案10】:import re
sentence = ' hello apple'
re.sub(' ','',sentence) #helloworld (remove all spaces)
re.sub(' ',' ',sentence) #hello world (remove double spaces)
【讨论】:
问题是删除所有空格,包括制表符和换行符,这个 sn-p 只会删除常规空格。【参考方案11】:要删除仅空格,请使用str.replace
:
sentence = sentence.replace(' ', '')
要删除所有空白字符(空格、制表符、换行符等),您可以使用split
然后join
:
sentence = ''.join(sentence.split())
或正则表达式:
import re
pattern = re.compile(r'\s+')
sentence = re.sub(pattern, '', sentence)
如果您只想从开头和结尾删除空格,可以使用strip
:
sentence = sentence.strip()
您还可以使用lstrip
仅删除字符串开头的空格,使用rstrip
删除字符串末尾的空格。
【讨论】:
注意:不需要编译步骤,re.sub(和朋友)缓存编译后的模式。另请参阅Emil's answer。 python3:yourstr.translate(str.maketrans('', '', ' \n\t\r'))
【参考方案12】:
要从开头和结尾删除空格,请使用strip
。
>> " foo bar ".strip()
"foo bar"
【讨论】:
该问题专门要求删除所有空格,而不仅仅是在末尾。请注意。 这个答案与这个问题无关以上是关于删除字符串中的所有空格的主要内容,如果未能解决你的问题,请参考以下文章
如何从PHP和Javascript中的字符串中删除所有空格[重复]
JavaScript:如何从 JSON 字符串中删除除值中的空格之外的所有空格?