如果字段被修改,指向重复 GPB 字段的项目的指针是否保持有效?

Do pointers to items of a repeated GPB field stay valid if the field is modified?

我正在编写一个使用 Google 协议缓冲区序列化数据的 C++ 应用程序。一切正常,但我担心我让一些东西过于复杂。

现在我有一个名为REPORT 的GPB 消息,其中有一个名为RECORD 的重复消息字段。我有一个名为 RecordManager 的 C++ class,它的对象负责管理 REPORT 中的各个 RECORD。这些 RecordManagers 保存在 std::vector 中。我定期遍历它们并告诉它们更新关联的 RECORD 对象。然后我将整个 REPORT 序列化为一个文件并继续。

我的问题是我将 RecordManager 与 RECORD 相关联的方式。现在,当我需要一条新记录时,我将一个新的 RECORD 添加到 repeated 字段,并在向量上构造一个新的 RecordManager,该向量具有新 RECORD 的索引。每次 RecordManager 更新它的 RECORD 时,它使用存储的索引将它定位在重复的字段上,然后执行它的工作。如果我想删除一条记录,我必须从向量中删除 RecordManager,将 RECORDs 字段上的最后一项与我要删除的那个交换,trim RECORDs 字段向下一个,然后更新具有新索引的交换字段的 RecordManager。真的不好看

我想做的是让每个 RecordManager 简单地保存一个指向重复字段上的 RECORD 的指针,这会使事情变得更加清晰。我找不到的(以及我一开始就这样做的原因)是 GPB 文档中的任何地方都保证这些指针在 allocations/deallocations 之后仍然有效。 运行 一些简单的测试并快速查看底层 RepeatedPtrField 代码,我似乎是安全的,但我不想仅仅依赖于未记录的实现。有没有足够熟悉 C++ GPB 库的人告诉我我是否安全?

我现在正在使用 GPB 2,但希望它能面向未来,如果这会有所作为的话。

谢谢!

编辑:添加了一些我用来测试的代码:

首先留言:

// test_message.proto
message RECORD{
   required int32 val = 1;
}

message REPORT{
   repeated RECORD record = 1;
}

来源:

// main.cpp
#include <iostream>
#include <vector>
#include "test_message.pb.h"

struct RecordManager{
   RECORD *my_record;
   RecordManager(RECORD * rec):my_record(rec){
     my_record->set_val(0);
   };
   void update(){
      my_record->set_val(my_record->val() + 1);
   }
};

int main (int argc, char ** argv){
   REPORT big_report;
   std::vector<RecordManager> managers;
   // Test using pointers while adding
   for (size_t i = 0; i < 10; i++){
      managers.push_back(RecordManager(big_report.add_record()));
      for (RecordManager manager : managers){
         manager.update();
      }
   }
   std::cout << big_report.DebugString() << std::endl;

   // Test using pointers after deleting from middle of repeated field
   big_report.mutable_record()->DeleteSubrange(5,1);
   managers.erase(managers.begin() + 5);
   for (RecordManager manager : managers){
      manager.update();
   }
   std::cout << big_report.DebugString() << std::endl;
   return 0;
}

我是 proto2 的作者,我会说你很安全。 RepeatedPtrField class 是一个 public 接口,大量代码,尤其是 Google 内部的代码,很大程度上取决于其内部工作原理。那里的一些代码实际上会在消息之间打乱子对象以避免分配;如果 class 不是一个指针数组,那将不会真正起作用,只要它是一个指针数组,使用任何在修改时使指向子对象的指针无效的实现都是愚蠢的。

也就是说,我不再从事 protobufs 的工作,所以我个人不能代表团队未来可能会做什么。