6.4.2 案例精选

Posted 2020-10-30 Avention

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了6.4.2 案例精选相关的知识，希望对你有一定的参考价值。

　　1 将当前目录的所有扩展名为html的文件重命名为扩展名为htm的文件。

 1 file_list = os.listdir(‘.‘)   #获取当前目录下的文件列表
 2 for filename in file_list:
 3     pos = filename.rindex(‘.‘)
 4     if filename[pos+1:] == ‘html‘:
 5         newname=filename[:pos + 1] + ‘htm‘
 6         os.rename(filename,newname)
 7         print(filename + ‘更名为:‘ + newname)
 8 
 9 #下面的代码可能更简洁一点
10 file_list = [filename for filename in os.listdir(‘.‘) if filename.endswith(‘html‘)]
11 for name in file_list:
12     newname = name[:-4] + ‘htm‘
13     os.rename(name,newname)
14     print(filename + ‘更名为:‘ + newname)

　　2 计算文件侧CRC32值

 1 import sys
 2 import zlib
 3 import os.path
 4 
 5 filename = sys.argv[0]   #第一个参数是文件名
 6 if os.path.isfile(filename):
 7     fp = open(filename,‘rb‘)
 8     contents = fp.read()
 9     fp.close()
10     print(zlib.crc32(contents.encode()))
11 else:
12     print(‘file not exists‘)

　　拓展知识：CRC又称循环冗余检查吗，常用于数据存储和通信领域，具有极强的检错能力。CRC32产生校验值时源数据快的每一个bit（位）都参与了计算，所以数据块中即使只有一位发生了变化，也会得到不同的CRC32值，也可用于文件完整性保护。

　　3 判断一个文件是否为GIF图像文件。任何一种文件都具有专门的文件头结构，在文件头中存放了大量的信息，其中就包括该文件的类型。通过文件头信息来判断文件类型的方法可以得到更加准确的信息，而不依赖于文件扩展名。

1 def is_gif(fname):
2     f = open(fname,‘r‘)
3     first4 = tuple(f.read(4))
4     f.close()
5     print(first4)
6     return first4 == (‘G‘,‘I‘,‘F‘,‘8‘)
7 
8 print(is_gif(‘test.gif‘))

　　4 编程程序，进行文件夹增量备份

　　程序功能与用法：指定源文件夹与目标文件夹，自动检测自上次备份以来源文件夹中内容的改变，包括修改的文件、新建的文件、新建的文件夹等，自动复制新增或修改过的文件到目标文件夹中，自上次备份以来没有修改过的文件将被忽略而不复制，从而实现增量备份。本例属于系统运维的范畴。

 1 import os
 2 import filecmp
 3 import shutil
 4 import sys
 5 
 6 def autoBackup(scrDir,dstDir):
 7     if ((not os.path.isdir(scrDir)) or (not os.path.isdir(dstDir))
 8         or (os.path.abspath(scrDir) != scrDir) or (os.path.abspath(dstDir) != dstDir)):
 9         usage()
10 
11     for item in os.listdir(scrDir):
12         scrItem = os.path.join(scrDir,item)
13         dstItem = scrItem.replace(scrDir,dstDir)
14 
15         if os.path.isdir(scrItem):
16             #创建新增的文件夹，保证目标文件夹的结构与原始文件夹一致
17             
18             if not os.path.exists(dstItem):
19                 os.makedirs(dstItem)
20                 print(‘make directory‘,dstItem)
21 
22             #递归调用自身函数
23             autoBackup(scrDir,dstDir)
24 
25         elif os.path.isfile(scrItem):
26             #只复制新增或修改过的文件
27             if ((not os.path.exists(dstItem)) or (not filecmp.cmp(scrItem,dstItem,shallow=False))):
28                 shutil.copyfile(scrItem,dstItem)
29                 print(‘file:‘ + scrItem + ‘==>‘ + dstItem)
30 
31 def usage():
32     print(‘scrDir and dstDir must be existing absolute path of certain directory‘)
33     print(‘For example:{0} c:\\olddir c:\\newdir‘.format(sys.argv[0]))
34     sys.exit(0)
35     
36     
37 if __name__ == ‘__main__‘:
38     if len(sys.argv) != 3:
39         usage()
40     scrDir,dstDir = sys.argv[1],sys.argv[2]
41     autoBackup(scrDir,dstDir)

　　5 编写程序，统计指定文件夹大小以及文件和子文件夹数量。本例也属于系统运维范畴，可用于磁盘配额的计算，例如 E-mail、博客、FTP、快盘等系统中每个账号所占空间大小的统计。

 1 import os
 2 
 3 totalSize = 0
 4 fileNum = 0
 5 dirNum = 0
 6 
 7 def visitDir(path):
 8 
 9     global totalSize
10     global fileNum
11     global dirNum
12 
13     for lists in os.listdir(path):
14         sub_path = os.path.join(path,lists)
15         if os.path.isfile(sub_path):
16             fileNum +=  1                             #统计文件数量
17             totalSize += os.path.getsize(sub_path)    #统计文件总大小
18 
19         elif os.path.isdir(sub_path):
20             dirNum += 1                               #统计子文件的数量
21             visitDir(sub_path)                        #递归统计子文件夹
22 
23 def main(path):
24     if not os.path.isdir(path):
25         print(‘Error:"‘,path,‘" is not a directory or does not exist.‘)
26         return
27 
28     visitDir(path)
29 
30 #单位换算函数
31 def sizeConvert(size):
32     K,M,G = 1024,1024 ** 2,1024 ** 3
33     if size >= G:
34         return ‘{:.4f}‘.format(size / G) + ‘ G Bytes‘
35 
36     elif size >= M:
37         return ‘{:.4f}‘.format(size / M) + ‘ M Bytes‘
38 
39     elif size >= K:
40         return ‘{:.4f}‘.format(size / K) + ‘ K Bytes‘
41     else:
42         return str(size) + ‘Bytes‘
43 
44 def output(path):
45     print(‘The total size of {}  is: {}  ({} Bytes)‘.format(path ,sizeConvert(totalSize),totalSize))
46     print(‘The total number of files in ‘ + path + ‘ is:‘,fileNum)
47     print(‘The total number of directories in ‘ + path + ‘ is:‘,dirNum)
48 
49 if __name__ == ‘__main__‘:
50     path = os.getcwd()
51     main(path)
52     output(path)
53 
54 ‘‘‘
55 The total size of C:\Users\dddd\...Python\Python35  is: 159.8924 M Bytes  (167659363 Bytes)
56 The total number of files in C:\Users\dddd\...Python\Python35 is: 6437
57 The total number of directories in C:\Users\dddd\...Python\Python35 is: 624
58 ‘‘‘

　　6 编写程序，递归删除指定文件夹中指定类型的文件。

　　本例代码也属于系统运维范畴，可用于清理系统中的临时垃圾文件或其他指定类型的文件，稍加扩展还可以删除大小为0字节的文件，大家可以自行补充和完成。

 1 from os.path import isdir,join,splitext
 2 from os import remove,listdir
 3 
 4 #指定要删除的文件类型
 5 filetypes = [‘.tmp‘,‘.log‘,‘.obj‘,‘.txt‘]
 6 
 7 def delCertainFiles(directory):
 8 
 9     if not isdir(directory):
10         print(‘应该输入路径‘)
11         return
12 
13     for filename in listdir(directory):
14         print(3)
15 
16         temp = join(directory,filename)
17 
18         if isdir(temp):
19             delCertainFiles(temp)
20 
21         elif splitext(temp)[1] in filetypes:
22             print(5)
23             remove(temp)
24             print(temp,‘deleted...‘)
25 
26 if __name__ == ‘__main__‘:
27     directory = r‘E:\test‘
28     #directory = sys.argv[1]
29     delCertainFiles(directory)

　　如果文件夹中有带特殊属性的文件或子文件夹，上面的代码可能会无法删除带特殊属性的文件，利用Python扩展pywin32可以解决该问题。

 1 import win32con
 2 import win32api
 3 import os
 4 from win32con import FILE_ATTRIBUTE_NORMAL
 5 
 6 def del_dir(path):
 7     for file in os.listdir(path):
 8         file_or_dir = os.path.join(path,file)
 9         if os.path.isdir(file_or_dir) and not os.path.islink(file_or_dir):
10             del_dir(file_or_dir)
11 
12         else:
13             try:
14                 os.remove(file_or_dir)    #尝试删除该文件
15             except:
16                 win32api.SetFileAttributes(file_or_dir,FILE_ATTRIBUTE_NORMAL)   #修改文件属性，设置为普通文件，再次删除
17                 os.remove(file_or_dir)
18 
19     os.rmdir(path)   #删除文件夹
20 
21 del_dir(r‘E:\test‘)

　　7 使用扩展库 openpyxl 读写 Excel 2007 以及更高版本的Excel 文件。

 1 import openpyxl
 2 
 3 from openpyxl import Workbook
 4 
 5 fn = r‘C:\Users\dddd\Desktop\aa.xlsx‘   #文件名
 6 wb = Workbook()                         #创建工作簿
 7 ws = wb.create_sheet(title=‘你好‘)      #创建工作表
 8 ws[‘A1‘] = ‘这是第一个单元格‘             #单元格复制
 9 ws[‘B1‘] = ‘3.1415926‘
10 wb.save(fn)                             #保存Excel
11 
12 wb = openpyxl.load_workbook(fn)         #打开指定索引的工作表
13 ws = wb.worksheets[1]                   #打开第二个sheet页
14 print(ws[‘A1‘].value)                   #读取并输出指定单元格的值
15 ws.append([1,2,3,4,5])                  #添加一行数据
16 ws.merge_cells(‘F2:F3‘)                 #合并单元格
17 ws[‘F2‘] = "=sum(A2:E2)"                #写入公式
18 
19 for r in range(10,15):
20     for c in range(3,8):
21         _=ws.cell(row=r,column=c,value=r*c)  #写入单元格数据
22 wb.save(fn)

　　假设某学校所有课程每学期允许多次考试，学生可随时参加考试，系统自动将每次成绩添加到Excel文件（包含 3 列：姓名、课程、成绩）中，现期末要求统计所有学生每门课程的最高成绩。下面的代码首先模拟生成随机成绩数据，然后进行统计分析。

 1 import openpyxl
 2 from openpyxl import Workbook,load_workbook
 3 import random
 4 
 5 def generateRandomInformation(filename):
 6     workbook = Workbook()
 7     worksheet = workbook.worksheets[0]
 8 
 9     worksheet.append([‘姓名‘,‘课程‘,‘成绩‘])
10 
11     #中文名字中的第一、第二、第三个字
12     first = tuple(‘赵钱孙李‘)
13     middle = tuple(‘为为为为‘)
14     last = tuple(‘坤燕只‘)
15 
16     #课程名称
17     subjects = (‘语文‘,‘数学‘,‘英语‘)
18 
19     #数据生成200个数据
20     for i in range(200):
21         line = []
22         r = random.randint(1,100)
23         name = random.choice(first)
24 
25         #按一定概率生成只有两个字的中文名字
26 
27         if r > 50:
28             name += random.choice(middle)
29         name += random.choice(last)
30 
31         #依次生成姓名、课程名称和成绩
32         line.append(name)
33         line.append(random.choice(subjects))
34         line.append(random.randint(0,100))
35 
36         worksheet.append(line)
37 
38     #保存数据，申城EXCEL 2007格式的文件
39     workbook.save(filename)
40 
41 #generateRandomInformation(r‘C:\Users\dddd\Desktop\aaa.xlsx‘)  #这行代码执行一次就可以了
42 
43 def getResult(oldfile,newfile):
44 
45     #用于存放结果数据的字典
46     result = dict()
47 
48     #打开原始数据
49     workbook = load_workbook(oldfile)
50     worksheet = workbook.worksheets[0]
51 
52     #遍历原始数据
53     #跳过第0行的表头
54     for row in worksheet.rows[1:]:
55 
56         #姓名、课程名称、本次成绩
57         name,subject,grade = row[0].value,row[1].value,row[2].value
58 
59         #获取当前姓名对应的课程名称和成绩信息
60 
61         #如果result字典中不包含，则返回空字典
62         t = result.get(name,{})
63 
64         #获取当前学生当前课程的成绩，若不存在返回0
65         f = t.get(subject,0)
66 
67         #只保留该学生该课程的最高成绩
68         if grade > f:
69             t[subject] = grade
70             result[name] = t
71 
72     #创建Excel文件
73     workbook1 = Workbook()
74     worksheet1 = workbook1.worksheets[0]
75     worksheet1.append([‘姓名‘,‘课程‘,‘成绩‘])
76 
77     #将result 字典中的结果数据写入 Excel 文件
78     for name,t in result.tiems():
79         for subject,grade in t.items():
80             worksheet1.append([name,subject,grade])
81     workbook1.save(newfile)
82 
83 if __name__ == ‘__main__‘:
84     oldfile = r‘C:\Users\dddd\Desktop\aaa.xlsx‘
85     newfile = r‘C:\Users\dddd\Desktop\aaaa.xlsx‘
86 
87     getResult(oldfile,newfile)

　　8 编写代码，查看指定ZIP和RAR压缩文件中的文件列表。

　　Python标准库zipfile提供了对ZIP和APK文件的访问。

1 import zipfile
2 fp = zipfile.ZipFile(r‘‘)
3 for f in fp.namelist():
4     print(f)
5 fp.close()

　　Python扩展库rarfile(可通过pip工具进行安装)提供了对RAR文件的访问。

1 import rarfile
2 r = rarfile.RarFile(r‘‘)
3 for f in r.namelist():
4     print(f)
5 r.close()

　　9 把记事本文件 test.txt转换成 Excel 2007 + 文件，假设test.txt文件中国第一行为表头，从第二行开始是实际数据，并且表头和数据航中的额不同字段信息都是用逗号分隔。

 1 from openpyxl import Workbook
 2 
 3 def main(txtFileName):
 4     new_XlsFileName = txtFileName[:-3] + ‘xlsx‘
 5 
 6     wb = Workbook
 7     worksheet = wb.worksheets[1]
 8 
 9     with open(txtFileName) as fp:
10         for line in fp:
11             line = line.strip().split(‘,‘)
12             worksheet.append(line)
13         wb.save(new_XlsFileName)
14 
15 main(‘infomation.txt‘)
16 
17 ‘‘‘
18 Traceback (most recent call last):
19   File "C:/Users/dddd/AppData/Local/Programs/Python/Python35/test1.py", line 15, in <module>
20     main(‘infomation.txt‘)
21   File "C:/Users/dddd/AppData/Local/Programs/Python/Python35/test1.py", line 7, in main
22     worksheet = wb.worksheets[1]
23 TypeError: ‘property‘ object is not subscriptable
24 ‘‘‘

以上是关于6.4.2 案例精选的主要内容，如果未能解决你的问题，请参考以下文章

使用 python 抓取谷歌精选片段

HeapDump性能社区OOM问题排查实战案例精选合集

30秒就能看懂的JavaScript 代码片段

案例精选 | 分布式消息队列差异化总结，太全了！

Python+matplotlib可视化设置图例4个精选案例