遍历目录中的所有文件并从每个文件中获取平均值

Loop through all files in a directory and get average value from each file

我在一个目录中有几个文件,我想将所有文件第一列中第一个和最后一个数字的平均值打印到一个文件中。请问怎么办?

此代码不完整:

# giving names of all files in a directory to the file files.txt - OK
import os
files = os.listdir("/media/linux/DATADISK")

with open('files.txt', 'w') as f:
    for item in files:
        f.write("%s\n" % item)

# loading the first column of all files into lists or dataframes with the name/key according files.txt and save average value to file average.txt
for i in files:
    np.loadtext(f'   .  ', unpack=True, usecols=[0]))
    average = (list[0]+list[-1])/2
    print(average, , file=open("average.txt","a"))

我不知道如何编写第二个 for 循环来加载文件(第一列),计算最后一个值和第一个值的平均值,并将其写入文件。它应该对目录中的所有文件执行此操作。我不知道如何写文件名 - 它们具有不同的名称和相同的扩展名。

例如,目录中有2个文件:klj.txt和gdf.dat

klj.txt

4 6 
6 5  
6 1

gdf.dat

4 5
2 0
8 1

输出average.txt应该是:

5 
6

首先,您不需要将文件写入 files.txt 的单独循环。您可以将整个操作作为 os.listdir 循环的一部分进行。您只需要形成每个文件的完整路径(稍后您需要传递给 np.loadtxt 的路径)。像这样:

import os
data_path = os.path.abspath("/media/linux/DATADISK")

for f in os.listdir(data_path):
    f_path = os.path.join(data_path, f)
    print(f_path)

# Output:
# /media/linux/DATADISK/gdf.dat
# /media/linux/DATADISK/klj.txt

然后,您可以使用np.loadtxtdelimiter参数指定每个文件的每一行由space分隔。如果您只对第一列感兴趣,那么您输入的 usecols 参数已经正确。

data = np.loadtxt(f_path, delimiter=' ', usecols=0)
print(data)

# Output:
# /media/linux/DATADISK/gdf.dat
# [4. 2. 8.]
# /media/linux/DATADISK/klj.txt
# [4. 6. 6.]

那么你的代码的平均部分已经正确了。但我建议先打开 average.txt 文件,这样你就不需要在每个循环中都 open 它了。

with open("average.txt", "a") as output:
    for f in os.listdir(data_path):
        ...
        average = (data[0] + data[-1]) / 2
        output.write(str(average) + "\n")

综合起来:

import numpy as np
import os
data_path = os.path.abspath("/media/linux/DATADISK")

with open("average.txt", "a") as output:
    for f in os.listdir(data_path):
        f_path = os.path.join(data_path, f)
        data = np.loadtxt(f_path, delimiter=' ', usecols=0)
        average = (data[0] + data[-1]) / 2
        output.write(str(average) + "\n")

样本average.txt:

6.0
5.0

订单将取决于 os.listdir 的 return,因此 gdf.bat 将在 [=35= 之前处理]klj.txt。