python模块与正则表达式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python模块与正则表达式相关的知识,希望对你有一定的参考价值。

一、模块

模块实质上就是一个python文件,它是用来组织代码的,意思就是说把python代码写到里面,文件名就是模块的名称,test.py test就是模块名称。

import 模块的实质就是把要导入模块里面的代码,从上到下执行一遍找模块的顺序是,先从当前目录下找,找不到的话,再环境变量里面找。

模块的分类:

? 标准库:python内置的

? 开源模块:第三方

? 自定义模块:自己写的

其中开源模块需要安装,安装方式有一下两种:

安装方式第一种:

这是操作系统命令,不是在python命令行里面执行

pip install xxx 安装某个模块

pip list 查看已经安装的模块

pip uninstall xxx卸载模块

pip这个模块呢,在python3里面是python自带的,安装完python就能直接用,但是在python2里面是没有这个模块的,需要你手动安装才能用

easy_install requests #这个也是傻瓜式的

第二种方式,手动安装:

1、先下载安装包,直接百度搜比如说python requests模块

2、解压安装包

3、在解压的目录下执行 python setup.py install

OS模块

print(os.getcwd())#取当前工作目录

print(os.chdir(r"e:\byz_code\day2"))#更改当前目录

print(os.mkdir("test1"))#创建文件夹

print(os.makedirs(r"test1\test2"))#递归创建文件夹,父目录不存在时创建父目录

print(os.removedirs(r"test1\test2"))#递归删除空目录

print(os.rmdir("test1"))#删除指定的文件夹,只能删除空文件夹

print(os.remove(r"E:\byz_code\day4\a.txt"))#删除文件

os.rename("test","test1")#重命名

print(os.sep)#当前操作系统的路径分隔符

print(__file__)#代表当前文件

print(os.path.abspath(‘bb.py‘))#获取绝对路径

print(__file__)#代表当前文件

print(os.path.dirname)

print(os.path.dirname(os.path.dirname(__file__)))#获取父目录

print(os.path.exists("hhaaa"))#目录/文件是否存在

print(os.path.isfile("bb.py"))#判断是否是一个文件

print(os.path.isdir("/usr/local"))#是否是一个路径

print(os.path.join("root",‘hehe‘,‘haha‘,‘a.log‘))

RE模块

re.match 只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none

re.search 匹配包含,search()会扫描整个字符串并返回第一个成功的匹配

re.findall 把所有匹配到的字符放到以列表中的元素返回

re.splitall 以匹配到的字符当做列表分隔符

re.sub 匹配字符并替换

 二、正则表达式

正则表达式

正则表达式就是用查找字符串的,它能查找规则比较复杂的字符串

数量词
‘*‘     匹配*号前的字符0次或多次,只是*前面的一个字符
print(re.findall(r‘a*b‘,‘ab a abbbbbb aab‘))
>>> [‘ab‘, ‘ab‘, ‘b‘, ‘b‘, ‘b‘, ‘b‘, ‘b‘, ‘aab‘]
‘+‘     匹配前一个字符1次或多次,只是+前面的一个字符
print(re.findall(r‘st+‘,‘besttest is best s‘))
>>> [‘stt‘, ‘st‘, ‘st‘]
‘?‘     匹配前一个字符1次或0次,只是?前面的一个字符
print(re.findall(r‘st?‘,‘besttest is best‘))
‘{2}‘   匹配前一个字符m次
print(re.findall(r‘t{2}er‘,‘besttest is best  letter letter‘))
>>> [‘tter‘,‘tter‘]
‘{n,m}‘ 匹配前一个字符n到m次
print(re.findall(r‘t{1,3}‘,‘besttest is best ttttt‘))
>>> [‘tt‘, ‘t‘, ‘t‘,‘ttttt‘]

一般字符
‘.‘     默认匹配除\n之外的任意一个字符
print(re.findall(r‘b.‘,‘besttest is good ba bf bo‘))
>>> [[‘be‘, ‘ba‘, ‘bf‘, ‘bo‘]
‘\‘   转译符,前面的* + ?这样的字符都有特殊含义了,如果你想就想找它的话,那就得转译了
意思就是说如果你想让特殊字符失去以前的含义,那么就得给它前面加上\
print(re.findall(r‘\?‘,‘besttest is best????‘))
>>> [‘?‘, ‘?‘, ‘?‘, ‘?‘]
‘|‘     匹配|左或|右的字符
print(re.findall(r‘best|is‘,‘besttest is best‘))
>>> [‘best‘, ‘is‘, ‘best‘
‘[]‘ 字符集合,某些字符的集合,匹配的时候是这个集合里面的任意一个就行
print(re.findall(r‘be[stacj]‘,‘besttest is best bejson bed‘))
>>>[‘bes‘, ‘bes‘, ‘bej‘]
[]里面如果用^的话代表取反,也就是不包括的这些字符串的
print(re.findall(r‘be[^stac]‘,‘besttest is best bejson‘))

边界匹配

‘^‘     匹配以什么字符开头,多行情况下匹配每一行的开头
print(re.findall(r‘^b‘,‘besttest is good\nbestest‘,re.M))   #re.M表示匹配多行
print(re.findall(r‘^http://‘,‘http://www.baidu.com is good\nbestest‘))
>>> [‘b‘]
print(re.findall(r‘^b‘,‘besttest is good\nbest‘),re.M)#多行模式
>>> [‘b‘,‘b‘]
‘$‘     匹配以什么字符结尾,多行情况下匹配每一行的结尾
print(re.findall(r‘d$‘,‘besttest is good‘))

 

未全整理完,后续整理

以上是关于python模块与正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

python常用模块与正则表达式

Python re模块与正则表达式详解

python与正则表达式:re模块详解

python 正则表达式与re模块

正则与python的re模块

7.17正则表达式与re模块