挂在 _dl_sysinfo_int80 上的多线程应用程序
Posted
技术标签:
【中文标题】挂在 _dl_sysinfo_int80 上的多线程应用程序【英文标题】:Mutli-threaded application hanging on _dl_sysinfo_int80 【发布时间】:2008-11-20 00:46:57 【问题描述】:我有一个多线程应用程序正在挂起对 _dl_sysinfo_int80() 的调用。根据gdb,所有线程都卡在这个调用中。
堆栈跟踪的顶部如下所示:
#0 0x002727a2 in _dl_sysinfo_int80 () from /lib/ld-linux.so.2
#1 0x004f23de in __lll_mutex_lock_wait () from /lib/tls/libpthread.so.0
#2 0x004ef00b in _L_mutex_lock_35 () from /lib/tls/libpthread.so.0
#3 0x092828ac in construction vtable for std::ostream-in-std::basic_stringstream<char, std::char_traits<char>, std::allocator<char> > ()
知道是什么原因造成的吗?
【问题讨论】:
【参考方案1】:int 80 是进行内核级系统调用的软件中断。我的猜测是 pthread 正在调用挂起的内核。为什么您的所有线程都会像这样挂在互斥锁上,可能有多种原因: - 互斥锁被另一个未释放锁而退出的线程锁定 - 互斥锁被正在键入以锁定它的线程之一锁定,并且未被声明为递归 - 互斥锁根本没有初始化 - 互斥体已被错误的指针、堆栈问题、其他类型的一般内存损坏损坏。
【讨论】:
【参考方案2】:SoapBox 是对的 - 你将不得不连接一个内核调试器来找出调用堆栈的内核部分并找出真正阻塞的原因
【讨论】:
【参考方案3】:快速浏览 glibc 源代码告诉我:
_dl_sysinfo_int80
,正如已经提到的另一个答案,是对int $0x80
的调用(调用内核);
__lll_mutex_lock_wait
似乎是 futex 实现的用户空间一半的功能之一。
这意味着在该堆栈跟踪或类似的线程中阻塞的所有线程实际上都在等待某种 pthread 同步对象(可能是 pthread 互斥体)。 @SoapBox 的回答中给出的所有原因都可能是原因。
除非您怀疑select is broken,否则无需查看该系统调用的内核端。
【讨论】:
以上是关于挂在 _dl_sysinfo_int80 上的多线程应用程序的主要内容,如果未能解决你的问题,请参考以下文章