Python字符串函数使用详解
Posted 涤生手记大数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python字符串函数使用详解相关的知识,希望对你有一定的参考价值。
Python的友好在于提供了非常好强大的功能函数模块,对于字符串的使用,同样提供许多简单便捷的字符串函数。Python 字符串自带了很多有用的函数,在字符串函数之前先介绍一个非常实用的dir()内置函数,因为对每一个初学者还是大佬级别的python程序员,都不能完全记住所有方法。而该函数可以查看所有这些函数,可调用 dir 并将参数指定为任何字符串(如 dir("")),其返回值包括字符串可以使用的变量、方法和定义的类型。
>>> dir("")
['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__',
'__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__',
'__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count',
'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric',
'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition',
'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
其也提供对功能函数的查询,比如经常使用的math()函数,所以无论是对后面所阐述的字符串函数还是其它函数,我们都可以用dir()内置函数来了解其它函数的类型、定义等等。下面所讲述的字符串函数会区分其不同功能来分开介绍,其函数的实现功能大致包含以下六个功能:索引特殊字符串、设置字符格式、修改字符串大小写、查看字符串特定格式、替换特定字符串、拆分特定字符串。
1 搜索字符串函数
假如我们需要在一段字符串中查找特定的子串时,通常涉及以下几个函数:
函数名 | 返回值 |
string.find(i) | 如果没有找到子串i,则返回 -1;否则 返回 子串i 在 string 中的起始位置 |
string.rfind(i) | 与 find 相同,但从右往左搜索 |
string.index(i) | 与 find 相同,但如果在 string 中找不到 i, 则引发 ValueError 异常 |
string.rindex(i) | 与 index 相同,但从右往左搜索 |
虽然这几个函数都实现了搜索特定字符串的功能,但还是包含一些区别的:
1. 函数 index 和 find 之间的差别在于没有找到指定子串时的情形 ,示例如下:
函数index会抛出异常 ValueError,而如果没有找到指定的子串,函数find将返回 -1。
2.字符串搜索函数通常从左往右(从开头往末尾)搜索,但以 r 打头的函数从右往左搜索。例如:
可以看到, 函数 find 和 index 返回传入字符串第一次出现时的起始位置索引,而 rfind 和 rindex 返回传入字符串最后一次出现时的起始位置索引。
2 设置字符串格式函数
下表列出了一些设置字符串格式的函数:
函数名 | 返回值 |
string.center(i) | 返回一个原字符串居中,并使用空格填充至长度 i 的新字符串 |
string.ljust(i) | 返回一个原字符串左对齐,并使用空格填充至长度 i 的新字符串 |
string.rjust(i) | 返回一个原字符串右对齐,并使用空格填充至长度 i 的新字符串 |
string.format(i) | 提供变量,格式化字符串(python2.6后新增) |
center(),ljust()和rjust()函数在日常用的使用很少,反倒是Python2.6以后的format()受到了广大字符串处理者的使用。使用format函数需要给它提供变量或者值,一个简单的例子:字符串中的 0 和 1 引用 format 的参数:它们将被替换为相应字符串或变量的值。也可以使用关键字参数的名称,
>>> '0 like eat 1'.format('Wangzi','banana')
'Wangzi like eat banana'
>>> 'who id is Linda'.format(who='My',id='name')
'My name is Linda'
这是一些比较简单的例子,还有更多细节方面的使用可以参考string — Common string operations — Python 3.10.1 documentation。下面举一个在抓取jmx数值的实际使用案例。在大数据组件使用过程中,我们通常抓取jmx接口的数据获取详情,然后将数据接到相关的展示系统中来监控和展示:例如我们需要抓取一个队列任务扥id,使用者,运行时间等指标值(此处IP做了处理,有问题可以咨询博主)。
import json
import urllib3
import re
def get_ative_resourcemanager(rm1, rm2):
http = urllib3.PoolManager()
rm_list = [rm1, rm2]
for resourcemanager in rm_list:
url = 'http://0/ws/v1/cluster/info'.format(resourcemanager)
response = http.request('GET', url)
data = json.loads(response.data)
ha_state = data['clusterInfo']['haState']
if ha_state == "ACTIVE":
return resourcemanager
'''Conversion time function'''
# 毫秒级转化为hour/minutes
def conver_time(allTime):
hours = (allTime/(60*60*1000))
return hours
'''get active resourcemanager yarn application metrics'''
def get_queue_metrics():
active_resoucemanager = get_ative_resourcemanager('ip1:port',
'ip2:port')
http = urllib3.PoolManager()
url = 'http://0/ws/v1/cluster/apps'.format(active_resoucemanager)
response = http.request('GET', url)
data = json.loads(response.data).get('apps').get('app')
length = len(data)
for i in range(length):
'''判断application状态'''
application_state = data[i]['state']
queue = data[i]['queue']
queue_name = re.findall(r'root.*',queue,re.IGNORECASE)
#print(mobdi_queue)
if (application_state == 'RUNNING' or application_state == 'ACCEPTED'):
if queue_name:
id_metric = data[i]['id']
user_metric = data[i]['user']
queue_metrics = data[i]['queue']
elapsed_time = data[i]['elapsedTime']
runtime_metric = conver_time(elapsed_time)
print(str(id_metric) + " " + str(user_metric) + " " + str(queue_metrics) + " " + str(runtime_metric))
if __name__ == '__main__':
''''''
get_queue_metrics()
执行结果:
3 改变字符串大小写函数
提供改变字符串大小写的函数有以下五个函数:
函数名 | 返回值 |
string.capitalize() | 字符串的第一个字符大写 |
string.lower() | 将 string 中所有大写字符转为小写 |
string.upper() | 将 string 中的小写字母转为大写 |
string.swapcase() | 转变 string 中的大小写 |
string.title() | 返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写 |
Python 提供了各种修改字母大小写的函数,如上表。但注意标红的地方,Python并没有修改字符串,而是在这几个函数中,创建并返回一个新字符串,并没有真正修改string源字符串。
4 选定字符串函数
选定字符串函数通常用于删除字符串开头或者末尾多余的字符串,具体有striip,lstrip和rstrip三个函数。
函数名 | 返回值 |
string.strip(i) | 从string开头和末尾删除所有包含在字符串i中的字符 |
string.lstrip(i) | 从string开头(左端)删除所有包含在字符串i中的字符 |
string.restrip(i) | 从string末尾(右端)删除所有包含在 字符串i中的字符 |
1.如果不加字符串,将删除空白字符串:
2.删除字符串情况:
5 拆分字符串函数
Python提供了以下几个拆分字符串的函数,主要将字符串拆分成多个子串。
函数名 | 返回值 |
string.partition(i) | 把string 拆分为三个字符串(head,i和tail),其中 head为i前面的子串, 而 tail 为i后面的子串 |
string. rpartition(i) | 与 partition 相同,但从 string 的右端开始搜索 i |
string.split(i) | 以 i 为分隔符,将 string 划分成一系列子串,并返回一个由这些子串组成的列表 |
string.rsplit(i) | 与 split 相同,但从 striing 的右端开始搜索 i |
string.splitlines(i) | 返回一个由 string 中的各行组成的列表 |
注意示例中存在string和string1两个字符串,函数 partition 和 rpartition 将字符串拆分为3部分,这两个函数总是返回一个这样的值:由3个字符串组成, 形式为 (head, sep, tail) ;而函数 split 以指定字符串为分隔符,将 字符串划分为一系列子串,返回一个字符串列表,列表总是分别以 [ 和 ] 打头和结尾,并用逗号分隔元素。splitlines函数按照行('\\r', '\\r\\n', \\n')分隔,返回一个包含各行作为元素的列表,使用很少,而且会自行判断字符串是否包含换行符。
6 替换字符串函数
Python内置两个字符串替换函数,包括:
函数名 | 返回值 |
string.replace(old, new) | 将 string 中的每个 old 替换为 new |
string.expandtabs(i) | 将 string 中的每个制表符替换为 n 个 空格 |
小练习
结合之前的Python字符串使用以及Python本身内置的字符串处理函数,做个小练习,用代码实现自定义的replace_替换函数,实现会在下次的文章中实现。
以上是关于Python字符串函数使用详解的主要内容,如果未能解决你的问题,请参考以下文章