Python 结构模块从文件中读取多个浮点数
Python struct module reading multiple floating points from file
从 开始解决了我的问题,我仍然面临无法使用 struct
一次读取多个 32 位浮点值的问题模块。
import struct
class Float32(object):
"""32-bit floating point object."""
# 4 bytes in each 32-bit floating point (8 bits in a byte)
size = 4
class DATA(object):
"""Object representation of information from a DATA file."""
def __init__(self, DATA_filepath, offset_values, data_sizes):
self.DATA_filepath = DATA_filepath
self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)
def read_DATA(self, DATA_filepath, offset_values, data_sizes):
"""Open DATA (*.data) file and read its contents."""
# initialize an empty list for the raw data
raw_data = []
# read binary data into the list
with open(DATA_filepath, 'rb') as input_DATA:
for idx, offset in enumerate(offset_values):
input_DATA.seek(offset)
buffer = input_DATA.read(Float32.size) * data_sizes[idx]
format_string = str(data_sizes[idx]) + 'f'
value = struct.unpack(format_string, buffer)
raw_data.append(value)
return raw_data
变量 format_string
看起来像 64f
或 data_sizes[idx]
在与 f
连接的每个循环迭代中的任何数字(参见 struct
module documentation 和上面的链接问题是这里的基本原理)。然而,这种方法似乎只是将相同的浮点数读入每个数组索引相同的次数aas data_sizes[idx]
,而不是唯一的值。我知道我的文件不应该产生这个结果,因为我正在将它从一个工作的 MATLAB 脚本翻译成 Python。
我的实现有什么问题?
编辑:
部分感谢回答,我注意到我的源代码中存在一些错误(用户指出的错误和其他影响我尝试读取文件的方式的错误)。我正在添加编辑后的源代码来充实问题,并为已接受答案的功劳提供更多解释。
class DATA(object):
"""Object representation of information from a DATA file."""
def __init__(self, DATA_filepath, offset_values, data_sizes):
self.DATA_filepath = DATA_filepath
self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)
def read_DATA(self, DATA_filepath, offset_values, data_sizes):
"""Open DATA (*.data) file and read its contents."""
# initialize an empty list for the raw data
raw_data = []
# read binary data into the list
with open(DATA_filepath, 'rb') as input_DATA:
for idx, offset in enumerate(offset_values):
input_DATA.seek(offset)
buffer = input_DATA.read(data_sizes[idx])
format_string = str(int(data_sizes[idx] / Float32.size)) + 'f'
value = struct.unpack(format_string, buffer)
raw_data.append(value)
return raw_data
做的时候:
buffer = input_DATA.read(Float32.size) * data_sizes[idx]
您只是在阅读 ONE 浮动并将其复制 data_sizes[idx] 次。
您只想执行以下操作:
buffer = input_DATA.read(Float32.size * data_sizes[idx])
从 struct
一次读取多个 32 位浮点值的问题模块。
import struct
class Float32(object):
"""32-bit floating point object."""
# 4 bytes in each 32-bit floating point (8 bits in a byte)
size = 4
class DATA(object):
"""Object representation of information from a DATA file."""
def __init__(self, DATA_filepath, offset_values, data_sizes):
self.DATA_filepath = DATA_filepath
self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)
def read_DATA(self, DATA_filepath, offset_values, data_sizes):
"""Open DATA (*.data) file and read its contents."""
# initialize an empty list for the raw data
raw_data = []
# read binary data into the list
with open(DATA_filepath, 'rb') as input_DATA:
for idx, offset in enumerate(offset_values):
input_DATA.seek(offset)
buffer = input_DATA.read(Float32.size) * data_sizes[idx]
format_string = str(data_sizes[idx]) + 'f'
value = struct.unpack(format_string, buffer)
raw_data.append(value)
return raw_data
变量 format_string
看起来像 64f
或 data_sizes[idx]
在与 f
连接的每个循环迭代中的任何数字(参见 struct
module documentation 和上面的链接问题是这里的基本原理)。然而,这种方法似乎只是将相同的浮点数读入每个数组索引相同的次数aas data_sizes[idx]
,而不是唯一的值。我知道我的文件不应该产生这个结果,因为我正在将它从一个工作的 MATLAB 脚本翻译成 Python。
我的实现有什么问题?
编辑:
部分感谢回答,我注意到我的源代码中存在一些错误(用户指出的错误和其他影响我尝试读取文件的方式的错误)。我正在添加编辑后的源代码来充实问题,并为已接受答案的功劳提供更多解释。
class DATA(object):
"""Object representation of information from a DATA file."""
def __init__(self, DATA_filepath, offset_values, data_sizes):
self.DATA_filepath = DATA_filepath
self.raw_data = self.read_DATA(DATA_filepath, offset_values, data_sizes)
def read_DATA(self, DATA_filepath, offset_values, data_sizes):
"""Open DATA (*.data) file and read its contents."""
# initialize an empty list for the raw data
raw_data = []
# read binary data into the list
with open(DATA_filepath, 'rb') as input_DATA:
for idx, offset in enumerate(offset_values):
input_DATA.seek(offset)
buffer = input_DATA.read(data_sizes[idx])
format_string = str(int(data_sizes[idx] / Float32.size)) + 'f'
value = struct.unpack(format_string, buffer)
raw_data.append(value)
return raw_data
做的时候:
buffer = input_DATA.read(Float32.size) * data_sizes[idx]
您只是在阅读 ONE 浮动并将其复制 data_sizes[idx] 次。
您只想执行以下操作:
buffer = input_DATA.read(Float32.size * data_sizes[idx])