多线程堆管理
Posted
技术标签:
【中文标题】多线程堆管理【英文标题】:Multithreaded Heap Management 【发布时间】:2011-01-10 14:53:27 【问题描述】:在 C/C++ 中,我可以在一个线程中分配内存并在另一个线程中删除它。然而,每当从堆中请求内存时,堆分配器都需要遍历堆以找到适当大小的空闲区域。两个线程如何在不破坏堆的情况下有效地访问同一个堆? (这是通过锁定堆来完成的吗?)
【问题讨论】:
重新标记,因为这实际上与任何特定的编程语言无关。 不完全正确。仅在增加堆时才涉及操作系统(这涉及在新内存页面中进行分页)。由 malloc/new 的 C/C++ 实现来实际管理堆。 【参考方案1】:是的,通常必须锁定对堆的访问。每当您拥有共享资源时,都需要保护该资源;内存是一种资源。
【讨论】:
即使每个线程都管理自己的内存?这听起来非常低效。 @deus:不,但这不是你描述的情况。你说线程正在共享内存。 (在另一个线程中删除。)【参考方案2】:这在很大程度上取决于您的平台/操作系统,但我相信这在主要系统上通常是可以的。 C/C++ 没有定义线程,所以默认情况下我相信答案是“堆不受保护”,你必须为你的堆访问提供某种多线程保护。
但是,至少对于 linux 和 gcc,我相信启用 -pthread 会自动为您提供这种保护...
另外,还有一个相关的问题:
C++ new operator thread safety in linux and gcc 4
【讨论】:
【参考方案3】:这是一个操作系统问题,因此答案将取决于操作系统。
在 Windows 上,每个进程都有自己的堆。这意味着同一进程中的多个线程(默认情况下)共享一个堆。因此,操作系统必须线程同步其分配和释放调用以防止堆损坏。如果您不喜欢可能发生的争用的想法,您可以使用Heap* routines 绕过它。您甚至可以重载 malloc(在 C 中)和 new(在 C++ 中)来调用它们。
【讨论】:
【参考方案4】:是的,支持多线程代码的“普通”堆实现必然包括某种锁定以确保正确操作。在相当极端的条件下(很多堆活动),这可能会成为瓶颈;更专业的堆(通常提供某种线程本地堆)可以在这种情况下提供帮助。我用过英特尔 TBB 的 "scalable allocator" 到 good effect。 tcmalloc 和 jemalloc 是考虑到多线程扩展的其他 malloc 示例。
单线程和多线程感知 malloc here 之间的一些时序比较比较。
【讨论】:
只是出于兴趣 gcc 和 MSVC 的 malloc 策略是什么? 好问题。不太了解 MSVC 的 CRT,但 gcc 通常与使用 ptmalloc 的 glibc 相关联:en.wikipedia.org/wiki/Malloc#dlmalloc_.28the_glibc_allocator.29。上面的时序链接很好地显示了这种扩展,这可以解释为什么我自己对 TBB 分配器的实验有时会使事情变得更好,有时会变得更糟。 @doron Windows Vista 和更新版本使用低碎片堆,据说这使得标准 malloc 在多线程程序中运行良好。【参考方案5】:我找到了this 链接。
基本上,堆可以划分为arena。请求内存时,依次检查每个arena是否被锁定。这意味着不同的线程可以同时安全地访问堆的不同部分。 Frees 有点复杂,因为每个 frees 都必须从分配它的 arena 中释放出来。我想一个好的实现会让不同的线程默认到不同的领域,以尽量减少争用。
【讨论】:
【参考方案6】:一般来说,您无需担心内存分配器的线程安全性。所有标准内存分配器——即 MacOS、Windows、Linux 等附带的内存分配器——都是线程安全的。锁是提供线程安全的标准方式,尽管可以编写只使用原子操作而不是锁的内存分配器。
现在,这些内存分配器是否缩放; 是一个完全不同的问题;也就是说,它们的性能是否与执行内存操作的线程数无关?大多数情况下,答案是否定的;它们要么减慢速度,要么会消耗大量更多内存。在两个维度(速度和空间)上的第一个可扩展分配器是Hoard(我写的); Mac OS X 分配器受到它的启发——并在文档中引用了它——但 Hoard 更快。还有其他的,包括 Google 的 tcmalloc。
【讨论】:
你能提供一些关于霍德所采用的一般策略的信息吗? 内存在称为超级块的块中进行管理,其中包含相同大小的对象。每个线程都会获得一些这些(线程本地),这意味着没有锁或争用。线程被多路复用到每个 CPU 堆上,其中包含超级块。超级块的分配一次只能由一个线程完成,从而限制了错误共享。 Hoard 通过在每个 CPU 堆变空时将大部分为空的超级块移动到共享堆来限制内存消耗——在确保渐近优化内存消耗的同时限制争用。见cs.umass.edu/~emery/hoard/asplos2000.pdf。以上是关于多线程堆管理的主要内容,如果未能解决你的问题,请参考以下文章