将二进制数据解析为原始类型的惯用方法

Question

我编写了以下方法来使用 GzDecoder from the Flate2 library

从 gzip 文件中解析二进制数据

fn read_primitive<T: Copy>(reader: &mut GzDecoder<File>) -> std::io::Result<T>
{
    let sz = mem::size_of::<T>();
    let mut vec =  Vec::<u8>::with_capacity(sz);
    let ret: T;
    unsafe{
        vec.set_len(sz);
        let mut s = &mut vec[..];
        try!(reader.read(&mut s));

        let ptr :*const u8 = s.as_ptr();
        ret = *(ptr as *const T)
    }
    Ok(ret)
}

它可以工作，但我对代码不是特别满意，尤其是使用虚拟向量和临时变量 ptr。这一切对我来说都很不雅观，我相信有更好的方法来做到这一点。我很乐意听到有关如何清理此代码的任何建议。

Answer 1

您的代码允许任何可复制 T，而不仅仅是基元。这意味着您可以尝试使用引用解析某些内容，这可能不是您想要的：

#[derive(Copy)]
struct Foo(&str);

但是，您的代码的总体草图是我所期望的。您需要一个临时的地方来存储一些数据，然后您必须将该数据转换为适当的原语（可能要处理 endinaness 问题）。

我推荐 byteorder 库。使用它，您可以为所需的原语调用特定方法：

reader.read_u16::<LittleEndian>()

由于这些方法知道所需的大小，因此它们可以堆栈分配一个数组以用作临时缓冲区，这可能比堆分配更有效。此外，我建议更改您的代码以接受具有 Read 特征的通用对象，而不是特定的 GzDecoder.

您可能还想查看像 rustc-serialize or serde 这样的序列化库，看看它们是否适合您的任何用例。

将二进制数据解析为原始类型的惯用方法

Idiomatic way to parse binary data into primitive types

rust