Python 结构模块从文件中读取多个浮点数

Python struct module reading multiple floating points from file

开始解决了我的问题,我仍然面临无法使用 struct 一次读取多个 32 位浮点值的问题模块。

import struct


class Float32(object):
    """32-bit floating point object."""

    # 4 bytes in each 32-bit floating point (8 bits in a byte)
    size = 4


class DATA(object):
    """Object representation of information from a DATA file."""

    def __init__(self, DATA_filepath, offset_values, data_sizes):
        self.DATA_filepath = DATA_filepath
        self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)

    def read_DATA(self, DATA_filepath, offset_values, data_sizes):
        """Open DATA (*.data) file and read its contents."""

        # initialize an empty list for the raw data
        raw_data = []

        # read binary data into the list
        with open(DATA_filepath, 'rb') as input_DATA:
            for idx, offset in enumerate(offset_values):
                input_DATA.seek(offset)
                buffer = input_DATA.read(Float32.size) * data_sizes[idx]
                format_string = str(data_sizes[idx]) + 'f'
                value = struct.unpack(format_string, buffer)
                raw_data.append(value)

        return raw_data

变量 format_string 看起来像 64fdata_sizes[idx] 在与 f 连接的每个循环迭代中的任何数字(参见 struct module documentation 和上面的链接问题是这里的基本原理)。然而,这种方法似乎只是将相同的浮点数读入每个数组索引相同的次数aas data_sizes[idx],而不是唯一的值。我知道我的文件不应该产生这个结果,因为我正在将它从一个工作的 MATLAB 脚本翻译成 Python。

我的实现有什么问题?

编辑:

部分感谢回答,我注意到我的源代码中存在一些错误(用户指出的错误和其他影响我尝试读取文件的方式的错误)。我正在添加编辑后的源代码来充实问题,并为已接受答案的功劳提供更多解释。

class DATA(object):
    """Object representation of information from a DATA file."""

    def __init__(self, DATA_filepath, offset_values, data_sizes):
        self.DATA_filepath = DATA_filepath
        self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)

    def read_DATA(self, DATA_filepath, offset_values, data_sizes):
        """Open DATA (*.data) file and read its contents."""

        # initialize an empty list for the raw data
        raw_data = []

        # read binary data into the list
        with open(DATA_filepath, 'rb') as input_DATA:
            for idx, offset in enumerate(offset_values):
            input_DATA.seek(offset)
            buffer = input_DATA.read(data_sizes[idx])
            format_string = str(int(data_sizes[idx] / Float32.size)) + 'f'
            value = struct.unpack(format_string, buffer)
            raw_data.append(value)

        return raw_data

做的时候:

buffer = input_DATA.read(Float32.size) * data_sizes[idx]

您只是在阅读 ONE 浮动并将其复制 data_sizes[idx] 次。

您只想执行以下操作:

buffer = input_DATA.read(Float32.size * data_sizes[idx])