遍历目录中的所有文件并从每个文件中获取平均值

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了遍历目录中的所有文件并从每个文件中获取平均值相关的知识,希望对你有一定的参考价值。

我在目录中有几个文件,我想将所有文件中第一列的第一个和最后一个数字的平均值打印到文件中。请怎么做?

此代码不完整:

# giving names of all files in a directory to the file files.txt - OK
import os
files = os.listdir("/media/linux/DATADISK")

with open('files.txt', 'w') as f:
    for item in files:
        f.write("%s\n" % item)

# loading the first column of all files into lists or dataframes with the name/key according files.txt and save average value to file average.txt
for i in files:
    np.loadtext(f'   .  ', unpack=True, usecols=[0]))
    average = (list[0]+list[-1])/2
    print(average, , file=open("average.txt","a"))

我不知道如何编写第二个for循环,该循环应加载文件(第一列),计算最后一个值和第一个值的平均值,然后将其写入文件。它应该对目录中的所有文件执行此操作。我不知道如何写文件名-它们具有不同的名称和相同的扩展名。

例如,目录中有2个文件:klj.txt和gdf.dat

klj.txt

4 6 
6 5  
6 1

gdf.dat

4 5
2 0
8 1

输出平均值.txt应该是:

5 
6
答案

首先,您不需要将文件写入files.txt的单独循环。您可以将整个操作作为os.listdir循环的一部分进行。您只需形成每个文件的完整路径(以后需要传递至np.loadtxt的路径)。像这样:

import os
data_path = os.path.abspath("/media/linux/DATADISK")

for f in os.listdir(data_path):
    f_path = os.path.join(data_path, f)
    print(f_path)

# Output:
# /media/linux/DATADISK/gdf.dat
# /media/linux/DATADISK/klj.txt

然后,您可以使用delimiternp.loadtxt参数指定每个文件的每一行都由空格分隔。如果只对第一栏感兴趣,则您输入的np.loadtxt参数已经正确。

usecols

然后,您已经使代码的平均部分正确了。但是我建议您首先打开average.txt文件,这样就不必在每个循环中都将其data = np.loadtxt(f_path, delimiter=' ', usecols=0) print(data) # Output: # /media/linux/DATADISK/gdf.dat # [4. 2. 8.] # /media/linux/DATADISK/klj.txt # [4. 6. 6.]

open

全部放在一起:

with open("average.txt", "a") as output:
    for f in os.listdir(data_path):
        ...
        average = (data[0] + data[-1]) / 2
        output.write(str(average) + "\n")

样本average.txt

import numpy as np
import os
data_path = os.path.abspath("/media/linux/DATADISK")

with open("average.txt", "a") as output:
    for f in os.listdir(data_path):
        f_path = os.path.join(data_path, f)
        data = np.loadtxt(f_path, delimiter=' ', usecols=0)
        average = (data[0] + data[-1]) / 2
        output.write(str(average) + "\n")

顺序将取决于6.0 5.0 的返回,因此gdf.bat将在klj.txt之前进行处理。

以上是关于遍历目录中的所有文件并从每个文件中获取平均值的主要内容,如果未能解决你的问题,请参考以下文章

需要搜索目录并遍历 zip 文件并阅读每个 [重复]

cmake 遍历目录获取所有文件名

php 循环遍历文件夹下面的所有目录及文件并且每个文件都写入一句话

如何使用 Gatling 遍历目录中的所有文件?

C#如何遍历指定目录以及指定目录下所有子文件夹,并获取除指定文件类型以外的所有文件的绝对路径?

php 遍历文件夹文件问题