re模块os模块subprocess模块

Posted kingyanan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了re模块os模块subprocess模块相关的知识,希望对你有一定的参考价值。

一、re模块

1、什么是正则
正则就是用一系列具有特殊含义的字符组成一套规则,该规则用来描述具有某一特征的字符串,
正则就是用来去一个大的字符串中匹配出符合规则的子字符串

2、为什么要用正则
1、用户注册
2、爬虫程序

3、如何用正则

技术分享图片

# =================================匹配模式=================================
#一对一的匹配
# ‘hello‘.replace(old,new)
# ‘hello‘.find(‘pattern‘)

#正则匹配
import re
#w与W
print(re.findall(w,hello egon 123)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘1‘, ‘2‘, ‘3‘]
print(re.findall(W,hello egon 123)) #[‘ ‘, ‘ ‘]

#s与S
print(re.findall(s,hello  egon  123)) #[‘ ‘, ‘ ‘, ‘ ‘, ‘ ‘]
print(re.findall(S,hello  egon  123)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘1‘, ‘2‘, ‘3‘]

#
 	都是空,都可以被s匹配
print(re.findall(s,hello 
 egon 	 123)) #[‘ ‘, ‘
‘, ‘ ‘, ‘ ‘, ‘	‘, ‘ ‘]

#
print(re.findall(r
,hello egon 
123)) #[‘
‘]
print(re.findall(r	,hello egon	123)) #[‘
‘]

#d与D
print(re.findall(d,hello egon 123)) #[‘1‘, ‘2‘, ‘3‘]
print(re.findall(D,hello egon 123)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘ ‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘ ‘]

#A与
print(re.findall(Ahe,hello egon 123)) #[‘he‘],A==>^
print(re.findall(123,hello egon 123)) #[‘he‘],==>$

#^与$
print(re.findall(^h,hello egon 123)) #[‘h‘]
print(re.findall(3$,hello egon 123)) #[‘3‘]

# 重复匹配:| . | * | ? | .* | .*? | + | {n,m} |
#.
print(re.findall(a.b,a1b)) #[‘a1b‘]
print(re.findall(a.b,a1b a*b a b aaab)) #[‘a1b‘, ‘a*b‘, ‘a b‘, ‘aab‘]
print(re.findall(a.b,a
b)) #[]
print(re.findall(a.b,a
b,re.S)) #[‘a
b‘]
print(re.findall(a.b,a
b,re.DOTALL)) #[‘a
b‘]同上一条意思一样

#*
print(re.findall(ab*,bbbbbbb)) #[]
print(re.findall(ab*,a)) #[‘a‘]
print(re.findall(ab*,abbbb)) #[‘abbbb‘]

#?
print(re.findall(ab?,a)) #[‘a‘]
print(re.findall(ab?,abbb)) #[‘ab‘]
#匹配所有包含小数在内的数字
print(re.findall(d+.?d*,"asdfasdf123as1.13dfa12adsf1asdf3")) #[‘123‘, ‘1.13‘, ‘12‘, ‘1‘, ‘3‘]

#.*默认为贪婪匹配
print(re.findall(a.*b,a1b22222222b)) #[‘a1b22222222b‘]

#.*?为非贪婪匹配:推荐使用
print(re.findall(a.*?b,a1b22222222b)) #[‘a1b‘]

#+
print(re.findall(ab+,a)) #[]
print(re.findall(ab+,abbb)) #[‘abbb‘]

#{n,m}
print(re.findall(ab{2},abbb)) #[‘abb‘]
print(re.findall(ab{2,4},abbb)) #[‘abb‘]
print(re.findall(ab{1,},abbb)) #‘ab{1,}‘ ===> ‘ab+‘
print(re.findall(ab{0,},abbb)) #‘ab{0,}‘ ===> ‘ab*‘

#[]
print(re.findall(a[1*-]b,a1b a*b a-b)) #[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall(a[^1*-]b,a1b a*b a-b a=b)) #[]内的^代表的意思是取反,所以结果为[‘a=b‘]
print(re.findall(a[0-9]b,a1b a*b a-b a=b)) #[]内的^代表的意思是取反,所以结果为[‘a=b‘]
print(re.findall(a[a-z]b,a1b a*b a-b a=b aeb)) #[]内的^代表的意思是取反,所以结果为[‘a=b‘]
print(re.findall(a[a-zA-Z]b,a1b a*b a-b a=b aeb aEb)) #[]内的^代表的意思是取反,所以结果为[‘a=b‘]

## print(re.findall(‘a\\c‘,‘ac‘)) #对于正则来说a\\c确实可以匹配到ac,但是在python解释器读取a\\c时,会发生转义,然后交给re去执行,所以抛出异常
print(re.findall(ra\\c,ac)) #r代表告诉解释器使用rawstring,即原生字符串,把我们正则内的所有符号都当普通字符处理,不要转义
print(re.findall(a\\\\c,ac)) #同上面的意思一样,和上面的结果一样都是[‘a\\c‘]

#():分组
print(re.findall(ab+,ababab123)) #[‘ab‘, ‘ab‘, ‘ab‘]
print(re.findall((ab)+123,ababab123)) #[‘ab‘],匹配到末尾的ab123中的ab
print(re.findall((?:ab)+123,ababab123)) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall(href="(.*?)",<a href="http://www.baidu.com">点击</a>))#[‘http://www.baidu.com‘]
print(re.findall(href="(?:.*?)",<a href="http://www.baidu.com">点击</a>))#[‘href="http://www.baidu.com"‘]

#|
print(re.findall(compan(?:y|ies),Too many companies have gone bankrupt, and the next one is my company))

 

 

 

re模块提供的方法介绍

# ===========================re模块提供的方法介绍===========================
import re
#1
print(re.findall(e,alex make love) )   #[‘e‘, ‘e‘, ‘e‘],返回所有满足匹配条件的结果,放在列表里
#2
print(re.search(e,alex make love).group()) #e,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。

#3
print(re.match(e,alex make love))    #None,同search,不过在字符串开始处进行匹配,完全可以用search+^代替match

#4
print(re.split([ab],abcd))     #[‘‘, ‘‘, ‘cd‘],先按‘a‘分割得到‘‘和‘bcd‘,再对‘‘和‘bcd‘分别按‘b‘分割

#5
print(===>,re.sub(a,A,alex make love)) #===> Alex mAke love,不指定n,默认替换所有
print(===>,re.sub(a,A,alex make love,1)) #===> Alex make love
print(===>,re.sub(a,A,alex make love,2)) #===> Alex mAke love
print(===>,re.sub(^(w+)(.*?s)(w+)(.*?s)(w+)(.*?)$,r52341,alex make love)) #===> love make alex

print(===>,re.subn(a,A,alex make love)) #===> (‘Alex mAke love‘, 2),结果带有总共替换的个数


#6
obj=re.compile(d{2})

print(obj.search(abc123eeee).group()) #12
print(obj.findall(abc123eeee)) #[‘12‘],重用了obj

 

 

二、os模块

1. os模块是与操作系统交互的一个接口

os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
os.curdir  返回当前目录: (‘.‘)
os.pardir  获取当前目录的父目录字符串名:(‘..‘)
os.makedirs(‘dirname1/dirname2‘)    可生成多层递归目录
os.removedirs(‘dirname1‘)    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir(‘dirname‘)    生成单级目录;相当于shell中mkdir dirname
os.rmdir(‘dirname‘)    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir(‘dirname‘)    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat(‘path/filename‘)  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"	
",Linux下为"
"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->‘nt‘; Linux->‘posix‘
os.system("bash command")  运行shell命令,直接显示
os.environ  获取系统环境变量
os.path.abspath(path)  返回path规范化的绝对路径
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小


2.os模块处理路径方法:
方式一:
import os
具体应用
import os,sys
possible_topdir = os.path.normpath(os.path.join(
    os.path.abspath(__file__),
    os.pardir, #上一级
    os.pardir,
    os.pardir
))
sys.path.insert(0,possible_topdir)


方式二:
os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))



三、suprocess模块
import subprocess

obj=subprocess.Popen(‘dir‘,
shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE
)

# print(obj)

res1=obj.stdout.read()
print(‘正确结果1111: ‘,res1)

res2=obj.stdout.read()
print(‘正确结果2222: ‘,res2) #只能取一次,取走了就没有了

# res2=obj.stderr.read()
# print(‘错误结果:‘,res2.decode(‘gbk‘)

 

以上是关于re模块os模块subprocess模块的主要内容,如果未能解决你的问题,请参考以下文章

python实现系统脚本命令调用模块---subprocess模块

python模块 os&sys&subprocess&hashlib模块

subprocess模块

subprocess模块

Python模块 - subprocess

subprocess模块