内核中的 Futex 和阻塞

Posted 2023-02-23

技术标签:

【中文标题】内核中的 Futex 和阻塞【英文标题】：Futexes and blocking in the kernel 【发布时间】：2016-01-17 10:56:52 【问题描述】：

我正在阅读一些文档并尝试了一些在 Linux 中发出 futex 系统调用的代码示例。我读到如果thread_a 使用FUTEX_LOCK_PI 获取互斥锁，并说如果另一个线程thread_b 尝试获取相同的，后者（thread_b）在内核中被阻止。

“在内核中阻塞”到底是什么意思？是不是thread_b 在用户空间的执行没有恢复？在以下示例中，第二个线程似乎也在系统调用之后发出 printf。这不是表明它没有在内核中被阻止吗？我错过了什么？

/*
 * This example demonstrates that when futex_lock_pi is called twice, the
 * second call is blocked inside the kernel.
 */

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

int mutex = 0;

#define  __NR_futex          240
#define FUTEX_WAIT 0
#define FUTEX_WAKE 1
#define FUTEX_FD 2
#define FUTEX_REQUEUE 3
#define FUTEX_CMP_REQUEUE 4
#define FUTEX_WAKE_OP 5
#define FUTEX_LOCK_PI 6
#define FUTEX_UNLOCK_PI 7
#define FUTEX_TRYLOCK_PI 8
#define FUTEX_WAIT_REQUEUE_PI 11
#define FUTEX_CMP_REQUEUE_PI  12


void *thread(void *arg) 
  int ret = 0;
  pid_t tid = gettid();
  printf("Entering thread[%d]\n", tid);

  ret = syscall(__NR_futex, &mutex, FUTEX_LOCK_PI, 1, NULL, NULL, 0);
  printf("Thread %d returned from kernel\n", tid);
  printf("Value of mutex=%d\n", mutex);
  printf("Return value from syscall=%d\n", ret);


int main(int argc, const char *argv[]) 
  pthread_t t1, t2;

  if (pthread_create(&t1, NULL, thread, NULL)) 
    printf("Could not create thread 1\n");
    return -1;
  

  if (pthread_create(&t2, NULL, thread, NULL)) 
    printf("Could not create thread 2\n");
    return -1;
  

  // Loop infinitely
  while ( 1 )  

  return 0;

输出如下：-

Entering thread[952]
Thread 952 returned from kernel
Entering thread[951]
Value of mutex=-2147482696
Return value from syscall=0
Thread 951 returned from kernel
Value of mutex=-1073740873
Return value from syscall=0

【问题讨论】：

你使用futexes in priority-inversion mode，它实际上与互斥锁一起工作（这就是为什么LOCK futex 操作名称中的子字符串）。在该模式下，futex 值转换方案已完全定义，并且不依赖于 futex 系统调用的 val 和 val2 参数。 未锁定状态下futex的值必须为0。检查一下。另外，在 PI 模式下，内核检查进程（线程）是否对应于存储在 futex 中的 tid 值，并实际访问它以执行优先级反转。据我了解，如果退出 futex 的所有者，则 mutex 被视为已解锁。尝试在线程函数末尾添加sleep()，并检查第二个线程是否在第一个线程（futex 所有者）休眠时从futex() 调用返回。（这不应该发生）。你把互斥锁初始化成什么？你能给我们完整的、可编译的代码吗？ @DavidSchwartz 我已将代码更新为完整且可编译，谢谢。您的代码和输出不匹配。您能否显示此代码的输出，并在理想情况下添加系统调用返回值？ 【参考方案1】：

在内核中阻塞意味着线程进入睡眠状态，直到有事件唤醒它，在你的情况下，事件是可用的互斥锁。

我稍微修改了你的代码来说明：

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
#include <sys/syscall.h>

static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;

void *thread(void *unused) 
  printf("Entering thread %d\n", syscall(SYS_gettid));

  pthread_mutex_lock(&mutex);

  sleep(2);

  pthread_mutex_unlock(&mutex);

  return NULL;


int main(int argc, const char *argv[]) 
  pthread_t t1, t2;

  printf("using mutex @%p\n", &mutex);

  if (pthread_create(&t1, NULL, thread, &t1)) 
    printf("Could not create thread 1\n");
    return -1;
  

  if (pthread_create(&t2, NULL, thread, &t2)) 
    printf("Could not create thread 2\n");
    return -1;
  

  pthread_join(t1, NULL);
  pthread_join(t2, NULL);

  return 0;

代码基本相同，但我明确使用 pthread 库的互斥锁。

如果我用 strace 运行这段代码，我会得到：

using mutex @0x6010a0
Process 19688 attached
Entering thread 19688
Process 19689 attached
Entering thread 19689
[pid 19689] futex(0x6010a0, FUTEX_WAIT_PRIVATE, 2, NULL <unfinished ...>
[pid 19688] futex(0x6010a0, FUTEX_WAKE_PRIVATE, 1) = 1
[pid 19689] <... futex resumed> )       = 0
[pid 19688] +++ exited with 0 +++
[pid 19689] futex(0x6010a0, FUTEX_WAKE_PRIVATE, 1) = 0
[pid 19689] +++ exited with 0 +++
+++ exited with 0 +++

您可能会注意到我们没有看到第一个线程使用互斥锁，但我们可以看到下一个正在等待的 futex (FUTEX_WAIT_PRIVATE)。这是因为在使用互斥锁时不会调用 futex。

但是你可以看到第一个线程（这里的 id 19688）最终调用了 futex(FUTEX_WAKE_PRIVATE)，它告诉内核在 utex 空闲时唤醒另一个线程。

您可能已经注意到第一次调用 [pid 19689] futex(0x6010a0, FUTEX_WAIT_PRIVATE, 2, NULL <unfinished ...> 是未完成的，这意味着进程被挂起，等待内核完成工作并交还手。然后[pid 19689] <... futex resumed> ) = 0 勾画出调用最终完成（显然是因为互斥体被释放了）

【讨论】：

以上是关于内核中的 Futex 和阻塞的主要内容，如果未能解决你的问题，请参考以下文章