如果字段被修改,指向重复 GPB 字段项的指针是不是仍然有效?

Posted

技术标签:

【中文标题】如果字段被修改,指向重复 GPB 字段项的指针是不是仍然有效?【英文标题】:Do pointers to items of a repeated GPB field stay valid if the field is modified?如果字段被修改,指向重复 GPB 字段项的指针是否仍然有效? 【发布时间】:2015-10-19 16:03:35 【问题描述】:

我正在编写一个使用 Google 协议缓冲区序列化数据的 C++ 应用程序。一切正常,但我担心我会让一些事情变得过于复杂。

现在我有一个名为 REPORT 的 GPB 消息,其中有一个名为 RECORD 的重复消息字段。我有一个名为 RecordManager 的 C++ 类,其对象负责管理 REPORT 中的各个 RECORD。这些 RecordManager 保存在 std::vector 中。定期地,我遍历它们并告诉它们更新它们关联的 RECORD 对象。然后我将整个 REPORT 序列化为一个文件并继续。

我的问题是我将 RecordManager 与 RECORD 关联的方式。现在,当我需要一条新记录时,我将一个新记录添加到重复字段,并在向量上构造一个新记录管理器,并为新记录提供一个索引。每次 RecordManager 更新它的 RECORD 时,它使用存储的索引在重复字段上定位它,然后执行它的工作。如果我想删除一条记录,我必须从向量中删除 RecordManager,将 RECORDs 字段中的最后一项与我要删除的项交换,将 RECORDs 字段向下修剪一个,然后为交换的 RecordManager 更新具有新索引的字段。真的不好看。

我想做的是让每个 RecordManager 简单地在重复字段上保存一个指向 RECORD 的指针,这会使事情变得更加清晰。我找不到(以及我首先这样做的原因)是在 GPB 文档中的任何地方保证这些指针在分配/解除分配后仍然有效。运行一些简单的测试并快速查看底层的 RepeatedPtrField 代码,我似乎是安全的,但我不想仅仅依赖于未记录的实现。有没有足够熟悉 C++ GPB 库的人告诉我我是否安全?

我现在正在使用 GPB 2,但希望它能够适应未来,如果这会有所作为的话。

谢谢!

编辑:添加了一些我用来测试的代码:

首先是消息:

// test_message.proto
message RECORD
   required int32 val = 1;


message REPORT
   repeated RECORD record = 1;

来源:

// main.cpp
#include <iostream>
#include <vector>
#include "test_message.pb.h"

struct RecordManager
   RECORD *my_record;
   RecordManager(RECORD * rec):my_record(rec)
     my_record->set_val(0);
   ;
   void update()
      my_record->set_val(my_record->val() + 1);
   
;

int main (int argc, char ** argv)
   REPORT big_report;
   std::vector<RecordManager> managers;
   // Test using pointers while adding
   for (size_t i = 0; i < 10; i++)
      managers.push_back(RecordManager(big_report.add_record()));
      for (RecordManager manager : managers)
         manager.update();
      
   
   std::cout << big_report.DebugString() << std::endl;

   // Test using pointers after deleting from middle of repeated field
   big_report.mutable_record()->DeleteSubrange(5,1);
   managers.erase(managers.begin() + 5);
   for (RecordManager manager : managers)
      manager.update();
   
   std::cout << big_report.DebugString() << std::endl;
   return 0;

【问题讨论】:

为什么不显示一些代码? 好点 - 添加了我的一个简单测试。 【参考方案1】:

我是proto2的作者,我会说你很安全。 RepeatedPtrField 类是一个公共接口,很多代码,尤其是在 Google 内部,都非常依赖于它的内部工作。那里的一些代码实际上在消息之间打乱子对象以避免分配;如果该类不是一个指针数组,那将不会真正起作用,并且只要它是一个指针数组,使用任何在修改时使指向子对象的指针无效的实现都是愚蠢的。

也就是说,我不再从事 protobufs 工作,因此我无法亲自代表团队未来可能会做什么。

【讨论】:

以上是关于如果字段被修改,指向重复 GPB 字段项的指针是不是仍然有效?的主要内容,如果未能解决你的问题,请参考以下文章

多版本并发控制(MVCC)的原理

添加到重复字段的指针会被自动删除吗?

memset 或 bzero 是不是保证结构中的字段指针将被清空?

删除指向子类的指针会调用基类析构函数吗?

Postgresql创建视图后修改基础表的问题

Firestore 安全规则 - 如何检查某个字段是不是被修改?