Pyhon 获取文件夹的大小统计

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pyhon 获取文件夹的大小统计相关的知识,希望对你有一定的参考价值。

通过Python 实现文件夹大小的统计:主要是通过了 import os 中的几个方法来实现。

                                            --Zero

Python OS 文件/目录方法

首先介绍用到的几个函数,写了一个小demo便于理解。

 技术分享

os.getcwd()

返回当前路径。 

os.listdir (path)

返回当前路径下的文件夹与文件(不向下二级递归)。

os.path.join()

join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

os.path 让join()识别为路径,根据系统自动补齐‘\\‘ ‘/‘。

os.path.getsize(path)  返回文件大小

 1 # -*- encoding: utf-8  -*_
 2 import os
 3 
 4 path = os.getcwd() # 获取当前路径
 5 for dirs in os.listdir(path):
 6     print dirs
 7 
 8 file_name = "路径补齐.txt"
 9 path = os.path.join(path,file_name)
10 print path
11 size = os.path.getsize("E:\\PythonEclipse\\PythonStudy\\os.listdir\\listdirs.py")
12 print size

输出结果:

1 A
2 B
3 C
4 file.txt
5 listdirs.py
6 E:\\PythonEclipse\\PythonStudy\\os.listdir\\路径补齐.txtA
7 303

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top -- 根目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。

topdown --可选,为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。

onerror -- 可选,是一个函数; 它调用时有一个参数, 一个OSError实例。报告这错误后,继续walk,或者抛出exception终止walk。

followlinks -- 设置为 true,则通过软链接访问目录。

1 # -*- encoding: utf-8  -*_
2 import os
3 
4 for root, dirs, filename in os.walk(os.getcwd()):
5     print root
6     print dirs
7     print filename

输出结果:

 1 E:\\PythonEclipse\\PythonStudy\\os.listdir
 2 [A, B, C]
 3 [file.txt, listdirs.py]
 4 E:\\PythonEclipse\\PythonStudy\\os.listdir\\A
 5 []
 6 []
 7 E:\\PythonEclipse\\PythonStudy\\os.listdir\\B
 8 []
 9 [file.txt]
10 E:\\PythonEclipse\\PythonStudy\\os.listdir\\C
11 []
12 []

功能实现思路:

需要获取文件夹的大小,只要遍历文件下所有的文件,获取所有文件大小求和即可。

这里是实现的是当前目录下,文件夹大小不包括当前文件下文件大小。

python的编码的格式,需要注意。

 1 # -*- encoding: utf-8 -*-
 2 import os
 3 rootdir = os.getcwd()               #获取当前路径
 4 
 5 rootdir = rootdir.decode(gbk)
 6 x  = u统计文件大小.csv
 7 f = open(os.path.join(rootdir,x), "w+")
 8 for dirname in  os.listdir(rootdir):  #获取二级目录所有文件夹与文件
 9     Dir = os.path.join(rootdir, dirname)    #路径补齐
10     count = 0
11     if (os.path.isdir(Dir)):           #判断是否为目录
12         for r, ds, files in os.walk(Dir): #遍历目录下所有文件根,目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名称】
13             for file in files:      #遍历所有文件
14                 size = os.path.getsize(os.path.join(r, file)) #获取文件大小
15                 count += size
16         if ((count/1024.0/1024.0) < 1024):
17             print  Dir +\\t + %.2f% (count/1024.0/1024.0)+MB
18             f.write(Dir.encode("gbk") +,+  %.2f% (count/1024.0/1024.0)+MB + \\n)
19         else:
20             print  Dir + \\t + %.2f % (count / 1024.0 / 1024.0/1024.0) + GB
21             f.write(Dir.encode("gbk") + , + %.2f % (count / 1024.0 / 1024.0/1024.0) + GB + \\n)
22     else:
23         continue
24 f.close()

以上是关于Pyhon 获取文件夹的大小统计的主要内容,如果未能解决你的问题,请参考以下文章

分享几个实用的代码片段(第二弹)

分享几个实用的代码片段(第二弹)

最简单的网络图片的爬取 --Pyhon网络爬虫与信息获取

统计文件夹大小的函数

pyhon模块制作及导入

du和df统计的磁盘分区大小不一致