Python字符串分割方法总结
Posted pythonedu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python字符串分割方法总结相关的知识,希望对你有一定的参考价值。
Python中字符串分割的常用方法是直接调用字符串的str.split
方法,但是其只能指定一种分隔符,如果想指定多个分隔符拆分字符串需要用到re.split
方法(正则表达式的split方法)。
str.split
字符串的split方法函数原型如下,其中sep为指定的分隔符,maxsplit为最大分割次数:
1
|
str.split(sep=None, maxsplit=-1)
|
默认情况下,不指定分隔符时则以空白字符(空格,回车,制表符等)作为分隔符拆分字符串:
1
2
3
4
|
[‘A‘, ‘B‘, ‘C‘, ‘D‘]
>>>
|
在结果列表中,不会包含空字符串:
1
2
3
4
|
[‘A‘, ‘B‘, ‘C‘, ‘D‘]
>>>
|
指定分隔符:
1
2
3
4
5
6
7
|
[‘www‘, ‘google‘, ‘com‘]
[‘AA‘, ‘BB‘, ‘CC‘, ‘DD‘]
>>>
|
指定最大分割次数:
1
2
3
4
5
6
7
|
[‘www‘, ‘google.com‘]
[‘AA‘, ‘BB‘, ‘CC||DD‘]
>>>
|
由此可见,当指定最大分割次数maxsplit
时,结果列表长度为maxsplit+1
。
但是,字符串的split方法只能指定一个分隔符,如下:
1
|
s = ‘AAAA,BBBB:CCCC;DDDD‘
|
如果想指定逗号、冒号、分号都做为分隔符,字符串的split方法是做不到的,此时要用正则表达式中的split方法。
re.split
正则表达式的split方法原型如下,其中pattern为指定的分隔正则表达式,string为要分割的字符串,maxsplit为最大分割次数,flags为正则表达式用到的通用标志:
1
|
re.split(pattern, string, maxsplit=0, flags=0)
|
参考示例:
1
2
3
4
5
|
[‘AAAA‘, ‘BBBB‘, ‘CCCC‘, ‘DDDD‘]
>>>
|
如果在正则表达式里使用了捕获组也就是括号,则结果列表中也会包含捕获的内容:
1
2
3
4
5
|
[‘AAAA‘, ‘,‘, ‘BBBB‘, ‘:‘, ‘CCCC‘, ‘;‘, ‘DDDD‘]
>>>
|
如果不想在结果中看到分隔符,但仍然想用括号对正则表达式模式进行分组,可以使用非捕获组,以(?:...)
的形式指定,示例如下:
1
2
3
4
5
|
[‘AAAA‘, ‘BBBB‘, ‘CCCC‘, ‘DDDD‘]
>>>
|
指定最大分割次数:
1
2
3
4
5
6
7
|
[‘AAAA‘, ‘BBBB:CCCC;DDDD‘]
[‘AAAA‘, ‘BBBB‘, ‘CCCC;DDDD‘]
>>>
|
由此可见,当指定最大分割次数maxsplit
时,结果列表长度为maxsplit+1
。
指定正则表达式中的通用标志flags:
1
2
3
4
|
[‘0‘, ‘3‘, ‘9‘]
>>>
|
原文链接:http://www.revotu.com/python-split-string-methods.html
以上是关于Python字符串分割方法总结的主要内容,如果未能解决你的问题,请参考以下文章