Pyhon 获取文件夹的大小统计
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pyhon 获取文件夹的大小统计相关的知识,希望对你有一定的参考价值。
通过Python 实现文件夹大小的统计:主要是通过了 import os 中的几个方法来实现。
--Zero
首先介绍用到的几个函数,写了一个小demo便于理解。
os.getcwd()
返回当前路径。
os.listdir (path)
返回当前路径下的文件夹与文件(不向下二级递归)。
os.path.join()
join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
os.path 让join()识别为路径,根据系统自动补齐‘\\‘ ‘/‘。
os.path.getsize(path) 返回文件大小
1 # -*- encoding: utf-8 -*_ 2 import os 3 4 path = os.getcwd() # 获取当前路径 5 for dirs in os.listdir(path): 6 print dirs 7 8 file_name = "路径补齐.txt" 9 path = os.path.join(path,file_name) 10 print path 11 size = os.path.getsize("E:\\PythonEclipse\\PythonStudy\\os.listdir\\listdirs.py") 12 print size
输出结果:
1 A 2 B 3 C 4 file.txt 5 listdirs.py 6 E:\\PythonEclipse\\PythonStudy\\os.listdir\\路径补齐.txtA
7 303
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
top -- 根目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。
topdown --可选,为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。
onerror -- 可选,是一个函数; 它调用时有一个参数, 一个OSError实例。报告这错误后,继续walk,或者抛出exception终止walk。
followlinks -- 设置为 true,则通过软链接访问目录。
1 # -*- encoding: utf-8 -*_ 2 import os 3 4 for root, dirs, filename in os.walk(os.getcwd()): 5 print root 6 print dirs 7 print filename
输出结果:
1 E:\\PythonEclipse\\PythonStudy\\os.listdir 2 [‘A‘, ‘B‘, ‘C‘] 3 [‘file.txt‘, ‘listdirs.py‘] 4 E:\\PythonEclipse\\PythonStudy\\os.listdir\\A 5 [] 6 [] 7 E:\\PythonEclipse\\PythonStudy\\os.listdir\\B 8 [] 9 [‘file.txt‘] 10 E:\\PythonEclipse\\PythonStudy\\os.listdir\\C 11 [] 12 []
功能实现思路:
需要获取文件夹的大小,只要遍历文件下所有的文件,获取所有文件大小求和即可。
这里是实现的是当前目录下,文件夹大小不包括当前文件下文件大小。
python的编码的格式,需要注意。
1 # -*- encoding: utf-8 -*- 2 import os 3 rootdir = os.getcwd() #获取当前路径 4 5 rootdir = rootdir.decode(‘gbk‘) 6 x = u‘统计文件大小.csv‘ 7 f = open(os.path.join(rootdir,x), "w+") 8 for dirname in os.listdir(rootdir): #获取二级目录所有文件夹与文件 9 Dir = os.path.join(rootdir, dirname) #路径补齐 10 count = 0 11 if (os.path.isdir(Dir)): #判断是否为目录 12 for r, ds, files in os.walk(Dir): #遍历目录下所有文件根,目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名称】 13 for file in files: #遍历所有文件 14 size = os.path.getsize(os.path.join(r, file)) #获取文件大小 15 count += size 16 if ((count/1024.0/1024.0) < 1024): 17 print Dir +‘\\t‘ + ‘%.2f‘% (count/1024.0/1024.0)+‘MB‘ 18 f.write(Dir.encode("gbk") +‘,‘+ ‘%.2f‘% (count/1024.0/1024.0)+‘MB‘ + ‘\\n‘) 19 else: 20 print Dir + ‘\\t‘ + ‘%.2f‘ % (count / 1024.0 / 1024.0/1024.0) + ‘GB‘ 21 f.write(Dir.encode("gbk") + ‘,‘ + ‘%.2f‘ % (count / 1024.0 / 1024.0/1024.0) + ‘GB‘ + ‘\\n‘) 22 else: 23 continue 24 f.close()
以上是关于Pyhon 获取文件夹的大小统计的主要内容,如果未能解决你的问题,请参考以下文章