从另一个线程访问线程本地

Posted 2023-02-22

技术标签:

【中文标题】从另一个线程访问线程本地【英文标题】：Access thread-local from another thread 【发布时间】：2011-03-15 09:34:45 【问题描述】：

如何从另一个线程读取/写入线程局部变量？也就是说，在线程 A 中，我想访问线程 B 的线程本地存储区中的变量。我知道另一个线程的 ID。

变量在 GCC 中被声明为 __thread。目标平台是 Linux，但独立性可能会很好（但 GCC 特定也可以）。

缺少线程启动钩子，我无法简单地在每个线程开始时跟踪该值。需要以这种方式跟踪所有线程（不仅仅是专门启动的线程）。

不能选择更高级别的包装器，例如 boost thread_local_storage 或使用 pthread 键。我需要使用真正的__thread 局部变量的性能。

第一个答案是错误的：不能将全局变量用于我想做的事情。每个线程都必须有自己的变量副本。此外，出于性能原因，这些变量必须是__thread 变量（同样有效的解决方案也可以，但我不知道）。我也不控制线程入口点，因此这些线程不可能注册任何类型的结构。

Thread Local is not private：对线程局部变量的另一个误解。这些绝不是线程的某种 private 变量。它们是全局可寻址内存，其限制是它们的生命周期与线程相关。如果给定指向这些变量的指针，则来自任何线程的任何函数都可以修改它们。上面的问题本质上是关于如何获取那个指针地址。

【问题讨论】：

当然，一般的想法是你不能。 :-) 为什么不让每个线程使用非本地数据结构报告其私有值？大概__thread 告诉编译器它可以使用CPU 寄存器。如果是这样，由于硬件限制，这将导致无法直接访问。 @SpliFF，__thread 局部变量最终只是普通内存中的位置。你可以把它的地址交给另一个线程来访问。 @Bo，这是我对缺少启动线程挂钩的评论。我无法拦截所有线程创建并注册变量。同样，对于从拥有线程对变量的任何读取访问，我不能有函数调用的开销。 @edA-qamort-ora-y 我也想问一个非常相似的问题，但是对于线程本地存储的 Windows 实现。您是否有机会找到问题的答案/解决方案？ 【参考方案1】：

如果你想要不是线程局部的线程局部变量，为什么不使用全局变量呢？

重要说明！

我并不是建议您使用单个全局变量来替换线程局部变量。我建议使用单个全局 array 或其他合适的值集合来替换一个线程局部变量。

当然，您必须提供同步，但由于您想将线程 A 中修改的值公开给线程 B，因此无法绕过。

更新：

GCC documentation on __thread 说：

当地址操作符是应用于线程局部变量，它在运行时评估并返回当前线程的地址该变量的实例。一个地址这样获得的任何线程都可以使用。当线程终止时，任何指针到其中的线程局部变量线程无效。

因此，如果您坚持这样做，我想可以在线程生成之后从它所属的线程获取线程局部变量的地址。然后，您可以将指向该内存位置的指针存储到映射（线程 id => 指针），并让其他线程以这种方式访问该变量。这假定您拥有生成线程的代码。

如果您真的很喜欢冒险，您可以尝试在___tls_get_addr 上挖掘信息（从this PDF 开始，由上述 GCC 文档链接）。但这种方法的编译器和平台特定性非常高，而且缺乏文档，以至于它应该会在任何人的脑海中引起警报。

【讨论】：

这不能解决我的问题。 @edA-qa mort-ora-y：我理解的问题是“我如何用锤子挖洞？”。这就是为什么我建议使用更合适的工具来完成这项工作。 @edA-qa mort-ora-y：在我看来，这个答案完美地解决了你的问题。根据定义，TLS 意味着“我不想在我的线程之间共享它”，并且编译器需要额外的工作来确保该属性。仅使用普通全局而不是尝试破解 TLS 的建议是有道理的。否则，这就像在咖啡里加盐然后倒进水槽，因为你不喜欢咖啡里加盐。 TLS 可以在线程之间共享：它和其他内存一样是可寻址内存。我正在寻找一种方法来发现这些变量地址，而无需源线程进行通信。 @edA-qa mort-ora-y：我知道线程本地的意思是“这个变量的多个副本”，而且原则上应该没有什么可以阻止你从“公开”一个变量。我已经更新了答案以明确说明；我仍然相信你是在逆流而上。【参考方案2】：

我正在寻找同样的东西。正如我所见，在以各种方式搜索网络后，没有人回答您的问题，我得到了后续信息：假设在 linux (ubuntu) 上为 gcc 编译并使用 -m64，段寄存器 gs 的值为 0。隐藏部分段的（保存线性地址）指向线程特定的局部区域。该区域在该地址包含该地址的地址（64 位）。在较低地址存储所有线程局部变量。该地址是native_handle()。因此，为了访问线程本地数据，您应该通过该指针进行操作。

换句话说：(char*)&variable-(char*)myThread.native_handle()+(char*)theOtherThread.native_handle()

假设 g++,linux,pthreads 演示上述代码是：

#include <iostream>
#include <thread>
#include <sstream>

thread_local int B=0x11111111,A=0x22222222;

bool shouldContinue=false;

void code()
    while(!shouldContinue);
    std::stringstream ss;
    ss<<" A:"<<A<<" B:"<<B<<std::endl;
    std::cout<<ss.str();


//#define ot(th,variable) 
//(*( (char*)&variable-(char*)(pthread_self())+(char*)(th.native_handle()) ))

int& ot(std::thread& th,int& v)
    auto p=pthread_self();
    intptr_t d=(intptr_t)&v-(intptr_t)p;
    return *(int*)((char*)th.native_handle()+d);


int main(int argc, char **argv)
       

        std::thread th1(code),th2(code),th3(code),th4(code);

        ot(th1,A)=100;ot(th1,B)=110;
        ot(th2,A)=200;ot(th2,B)=210;
        ot(th3,A)=300;ot(th3,B)=310;
        ot(th4,A)=400;ot(th4,B)=410;

        shouldContinue=true;

        th1.join();
        th2.join();
        th3.join();
        th4.join();

    return 0;

【讨论】：

唉……太不便携了。 [如果 gcc 的 std::thread 将停止使用 pthreads 作为 native_handle 怎么办？还是结构变化？任何下一次 gcc 更新都会发生这种情况。]【参考方案3】：

很遗憾，我一直没能找到办法。

如果没有某种线程初始化钩子，似乎就无法获得该指针（缺少依赖于平台的 ASM hack）。

【讨论】：

【参考方案4】：

这是一个老问题，但既然没有给出答案，为什么不使用一个有自己的静态注册的类呢？

#include <mutex>
#include <thread>
#include <unordered_map>

struct foo;

static std::unordered_map<std::thread::id, foo*> foos;
static std::mutex foos_mutex;

struct foo

    foo()
    
        std::lock_guard<std::mutex> lk(foos_mutex);
        foos[std::this_thread::get_id()] = this;
    
;

static thread_local foo tls_foo;

当然，您需要在线程之间进行某种同步，以确保线程已经注册了指针，但是您可以从您知道线程 ID 的任何线程的映射中获取它。

【讨论】：

我给出的答案是，似乎不可能按照我的要求去做。有很多方法可以做其他事情，但问题的严格要求似乎无法满足。我想我不明白为什么这不能满足您的要求。您不需要知道线程入口点，只需定义一个结构，该结构将在构造时注册一个指向自身的指针，然后将该结构设为您的__thread 变量。除了在线程启动时进行初始注册之外，这样做不会产生任何开销。

以上是关于从另一个线程访问线程本地的主要内容，如果未能解决你的问题，请参考以下文章