如何将 stl 容器保存在磁盘中?

How to save stl container in disk?

我有一个stl容器,可以保存很多数据。

例如定义为:

std::unordered_map<std::string, std::vector<int32_t> > m;  // there are 10 million data in this container

我想要的是将它保存在一个文件中,下次我可以读取这个文件来快速恢复它。

我认为正常的方式,例如:

write(&m, sizeof(m))

不起作用,因为它只保存指针。

那么,如何将它保存到文件中并通过读取文件恢复它?

选择文件格式,例如一个简单的列表,遍历你的容器并写下每个元素:

for (const auto &el : m) {
    file << el.first << '\n' << el.second.size() << '\n';
    for (const auto &vecEl : el.second) {
        file << vecEl << '\n';
    }
}

然后你可以用

读取文件
std::string first;
std::size_t count;
while (std::getline(file, first) && file >> count) {
    std::vector<int32_t> v(count);
    for (auto &vecEl : v) {
        file >> vecEl;
    }
    std::cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n');
    m[first] = v;
}

这只是草图。您可能必须添加错误检查。

鉴于您不热衷于使用 boost,最省力且可重用性最低的选项类似于:

// some support macros for easy error detection/handling...

#define FATAL(MSG) \
    do { \
         std::cerr << "FATAL ERROR at line " << __LINE__ << ":\n" \
             "    " << MSG << '\n'; \
         exit(EXIT_FAILURE); \
    } while (false)

#define ASSERT(X, MSG) \
     do { \
         if (X) break; \
         FATAL("ASSERT(" #X ") FAILED; " << MSG); \
     } while (false)

// output your container to disk...

if (std::ofstream out{filename}) {
    for (auto& [key, value] : m) {
        out << key.size() << ' ';
        out.write(key.data(), key.size();
        out << ' ' << value.size();
        for (auto& i : values)
            out << ' ' << i;
        out >> '\n';
    }
    ASSERT(out, "failed while writing to " << filename);
}
else
    FATAL("failed to create " << filename);

这只会创建一个包含以下行的文件:

13 A 13 char str 5 1 2 3 4 5

前导 13 意味着您在解析之前就知道字符串中有多少个字符,这使我们免于提出一些转义和终止符约定的麻烦,或者没有这些约定的风险(例如,假设字符串没有't 嵌入换行符通常是有风险的)。第一个“5”表示数组长度,只需要加快加载速度,因为它可以让您预先保留足够的内存,这可能比使用 .push_back 并且在加载数组期间必须 resize 更快.

读取文件变成:

if (std::ifstream in{filename}) {
    size_t len;
    while (in >> len) {
        std::string key;
        key.resize(len);
        ASSERT(in.read(key.data(), len));
        ASSERT(in >> len);
        std::vector<int32_t> v;
        v.reserve(len);
        while (len--) {
            ASSERT(in >> num);
            v.push_back(num);
        }
    }
    ASSERT(out.eof(), "failed to parse string size");
    m[std::move(key)] = std::move(v);
}
else
    FATAL("failed to open " << filename);

我还没有测试过这个,所以 use/test/debug 根据需要....