将动态分配的内存从 C++ 返回到 C
Posted
技术标签:
【中文标题】将动态分配的内存从 C++ 返回到 C【英文标题】:Return dynamically allocated memory from C++ to C 【发布时间】:2008-11-12 08:18:50 【问题描述】:我有一个必须可以从 C 等语言中使用的 dll,所以我不能像往常一样使用字符串对象等,但我不确定如何安全地执行此操作..
const char *GetString()
std::stringstream ss;
ss << "The random number is: " << rand();
return ss.str().c_str();
当 ss 从堆栈中掉下来时,c 字符串会被销毁吗?我猜是……
另一种选择可能是在堆上创建一个新字符串,但如何释放它?
const char *GetString()
std::stringstream ss;
ss << "The random number is: " << rand();
char *out = new char[ss.str().size()];
strcpy(ss.str().c_str(), out);
return out;//is out ever deleted?
指向其他事物的指针和字符串也是如此。
【问题讨论】:
【参考方案1】:第一个变体不起作用,因为您要返回一个指向堆栈对象的指针,该堆栈对象将被销毁。 (更确切地说,您返回一个指向堆内存的指针,该指针将被删除()。)更糟糕的是,如果没有人覆盖内存,它甚至可能工作一段时间,这使得调试变得非常困难。
接下来,你不能返回一个 const char*,除非你像这样返回一个指向静态字符串的指针:
const char *GetString()
return "a static string in DATA segment - no need to delete";
您的第二个变体存在将使用 new() 分配的内存返回到将调用 free() 的 C 程序的问题。这些可能不兼容。
如果你将一个字符串返回给 C,有两种方法可以做到这一点:
char *GetString()
std::stringstream ss;
ss << "The random number is: " << rand();
return strdup( ss.str().c_str() ); // allocated in C style with malloc()
void foo()
char *p = GetString();
printf("string: %s", p));
free( p ); // must not forget to free(), must not use delete()
或:
char *GetString(char *buffer, size_t len)
std::stringstream ss;
ss << "The random number is: " << rand();
return strncpy(buffer, ss.str().c_str(), len); // caller allocates memory
void foo()
char buffer[ 100 ];
printf("string: %s", GetString(buffer, sizeof( buffer ))); // no memory leaks
取决于您的内存处理策略。
通常,您永远不能在 C++ 中返回指向自动对象的指针或引用。这是许多 C++ 书籍中分析的常见错误之一。
【讨论】:
【参考方案2】:多年来,C 将其归结为 2 种标准方法:
调用者传入缓冲区。 这有三个版本。 版本 1:传递缓冲区和长度。 版本 2:文档指定了预期的最小缓冲区大小。 第 3 版:飞行前。函数返回所需的最小缓冲区。调用者第一次使用 NULL 缓冲区调用两次。 示例:read() 使用在下一次调用前有效的静态缓冲区。 示例:tmpname()一些非标准的返回你必须明确释放的内存
strdup() 突然出现在脑海中。 通用扩展,但实际上不在标准中。【讨论】:
【参考方案3】:第一个实际上不起作用,因为字符串流在销毁时释放了它的空间。因此,如果您尝试取消引用该指针,那么您的程序很可能会崩溃。
您提到的第二个选项是它通常是如何完成的,并且该函数的用户需要释放空间。如果这是一个使用该函数的 C 程序,请确保使用 malloc() 分配并使用 free() 释放
另一种选择是返回静态字符数组的地址。如果您事先知道长度的良好上限,则这是相关的。更重要的是,只有在不可能同时从两个不同的线程调用函数时才应该使用它,因为使用静态数组本质上会使您的函数非reentrant。
【讨论】:
好的,我的 dll 确实适用于 python,那么最好的方法是什么?我应该将 dll 函数包装在说“调用 dll 函数;调用 dll 释放函数”的 python 函数中吗?我假设 python 制作了一个全新的字符串,而不是仅仅在它周围包裹一个对象?【参考方案4】:很明显,每当您返回指向函数内部分配的内存的指针时,解除分配必须来自外部,除非您使用垃圾回收。如果您不想这样做,请在调用 GetString() 之前分配一个字符缓冲区并将原型更改为
int get_string(const char* buffer);
然后填满缓冲区。但是将一个点返回给分配的数据是可以的。
【讨论】:
请同时传递缓冲区的大小!【参考方案5】:如果您将 ss 声明为静态,则可以避免该问题。如果您的程序在单线程环境中运行,这可能是一个很好的解决方案。
【讨论】:
但是一旦再次调用该函数,结果就会无效。从那一刻起,只有第二次调用的结果有效。 让尖叫声变得静止会使事情变得更糟。他们会分享字符串吗?流是否保证指针不会改变(否)?它会删除重新分配的指针(是)吗?在第二次调用后,第一个调用者将留下一个死指针,等等。不去【参考方案6】:如果你想安全地返回它,你必须在堆上分配字符串,也可以使用 malloc() i.s.o 进行分配。 new() 在编写 C 函数时。
当你返回指针时(而且,与 C++ 不同,在 C 中你很多时候没有真正的选择),释放总是一个问题。没有真正的明确解决方案。
我在很多 API 中看到的一种处理方法是调用所有函数
CreateString()
当调用者需要释放内存时,以及
GetString()
当这不是问题时。
当然,这绝不是万无一失的,但如果有足够的纪律,这是我见过的最好的方法,老实说......
【讨论】:
【参考方案7】:如果线程安全不重要,
const char *GetString()
static char *out;
std::stringstream ss;
ss << "The random number is: " << rand();
delete[] out;
char *out = new char[ss.str().size()];
strcpy(ss.str().c_str(), out);
return out;//is out ever deleted?
然后函数可以接管解除分配字符串的责任。
如果线程安全很重要,
那么最好的方法就是将其作为参数传入,如,
void GetString(char *out, int maxlen);
我观察到当旧的非线程安全 API 更改为线程安全时会发生这种情况。
【讨论】:
1) 产生静态的原因是什么? 2) 你不能返回 const char* 3) 你不能将新的内存返回到 C 程序中 1) 以便在调用 GetString 之间保留最后一个新内存的地址。 2)好的,同意C没有const。然后返回 char *。 3)只要C程序不调用free就没有关系。【参考方案8】:调用函数后,您会希望调用者负责字符串的内存(尤其是取消分配它)。除非你想使用静态变量,但有龙!干净利落的最好方法是让调用者首先分配内存:
void foo()
char result[64];
GetString(result, sizeof(result));
puts(result);
然后 GetString 应该如下所示:
int GetString(char * dst, size_t len)
std::stringstream ss;
ss << "The random number is: " << rand();
strncpy(ss.str().c_str(), dst, len);
传递最大缓冲区长度并使用 strncpy() 将避免意外覆盖缓冲区。
【讨论】:
【参考方案9】:到目前为止的答案并没有解决一个非常重要的问题,即如果结果所需缓冲区的长度未知并且可以在调用之间更改,即使使用相同的参数(例如从一个数据库),所以我提供了我认为是处理这种情况的最佳方法。
如果事先不知道大小,请考虑将回调函数传递给您的函数,该函数接收const char*
作为参数:
typedef void (*ResultCallback)( void* context, const char* result );
void Foo( ResultCallback resultCallback, void* context )
std::string s = "....";
resultCallback( context, s.c_str() );
ResultCallback
的实现可以分配需要的内存并复制result
指向的缓冲区。我假设是 C,所以我没有明确地向/从 void*
转换。
void UserCallback( void* context, const char* result )
char** copied = context;
*copied = malloc( strlen(result)+1 );
strcpy( *copied, result );
void User()
char* result = NULL;
Foo( UserCallback, &result );
// Use result...
if( result != NULL )
printf("%s", result);
free( result );
这是最便携的解决方案,甚至可以处理无法预先知道返回字符串大小的最棘手的情况。
【讨论】:
【参考方案10】:随着时间的推移,有多种方法可以从函数返回可变数量的数据。
-
调用者传入缓冲区。
-
记录了必要的大小但未通过,缓冲区太短为Undefined Behavior:
strcpy()
记录并传递必要的大小,返回值指示错误:strcpy_s()
需要的大小未知,但可以通过调用缓冲区长度为0的函数来查询:snprintf
所需大小未知且无法查询,返回的大小与传递大小的缓冲区中的大小相同。如有必要,必须拨打其他电话以获取其余信息:fread
⚠ 所需大小未知,无法查询,传递的缓冲区太小为Undefined Behavior。这是一个设计缺陷,因此该功能在较新的版本中已被弃用/删除,为了完整起见,此处仅提及:gets
。
-
回调函数获取上下文参数:
qsort_s
回调函数没有上下文参数。获取上下文需要魔法:qsort
fopen
->fclose
strdup
->free
被调用者返回一个包含释放器的对象:COM-Objects std::shared_ptr
被调用者使用内部共享缓冲区:asctime
一般来说,每当用户必须猜测尺寸或在手册中查找时,他有时会弄错。如果他没有弄错,以后的修改可能会使他的仔细工作失效,所以他曾经是对的也没关系。反正这边是madness (UB)。
对于其余的,请选择最舒适和最有效的。
【讨论】:
以上是关于将动态分配的内存从 C++ 返回到 C的主要内容,如果未能解决你的问题,请参考以下文章