为啥 DTrace 有时但并非总是给我无效地址错误?

Posted

技术标签:

【中文标题】为啥 DTrace 有时但并非总是给我无效地址错误?【英文标题】:Why does DTrace give me invalid-address errors sometimes but not always?为什么 DTrace 有时但并非总是给我无效地址错误? 【发布时间】:2009-07-29 04:57:02 【问题描述】:

我的程序:

typedef struct objc_class 
    struct objc_class *isa;
    struct objc_class *super_class;
    char *name;
    long version;
    long info;
    long instance_size;
    void *ivars;
    void *methodLists;
    void *cache;
    void *protocols;
 *Class;
struct objc_object 
    Class isa;
;

/* Code to extract the class name from arg0 based on a snippet by Bill Bumgarner: http://friday.com/bbum/2008/01/26/objective-c-printing-class-name-from-dtrace/ */

objc$target:NSObject:-init:entry 
    printf("time: %llu\n", timestamp);
    printf("arg0: %p\n", arg0);
    obj = (struct objc_object *)copyin(arg0, sizeof(struct objc_object));
    printf("obj: %p\n", obj);
    printf("obj->isa: %p\n", obj->isa);
    isa = (Class)copyin((user_addr_t)obj->isa, sizeof(struct objc_class));
    printf("isa: %p\n", obj->isa);
    classname = copyinstr((user_addr_t)(isa->name));
    printf("classname: %s\n", classname);

一些输出:

dtrace: script 'test.d' matched 1 probe
dtrace: error on enabled probe ID 1 (ID 61630: objc5936:NSObject:-init:entry): invalid address (0x90206b98) in action #8 at DIF offset 28
dtrace: error on enabled probe ID 1 (ID 61630: objc5936:NSObject:-init:entry): invalid address (0x90206b98) in action #8 at DIF offset 28
dtrace: error on enabled probe ID 1 (ID 61630: objc5936:NSObject:-init:entry): invalid address (0x90206b98) in action #8 at DIF offset 28
CPU     ID                    FUNCTION:NAME
  0  61630                      -init:entry time: 28391086668386
arg0: 1291ae10
obj: 6f0a1158
obj->isa: a023f360
isa: a023f360
classname: NSBitmapImageRep

  1  61630                      -init:entry time: 28391586872297
arg0: 12943560
obj: 6f4a1158
obj->isa: 2fca0
isa: 2fca0
classname: GrowlApplicationTicket

  1  61630                      -init:entry time: 28391586897807
arg0: 152060
obj: 6f4a1280
obj->isa: 2fe20
isa: 2fe20
classname: GrowlNotificationTicket

  2  61630                      -init:entry time: 28391079142905
arg0: 129482d0
obj: 700a1128
obj->isa: a0014140
isa: a0014140
classname: NSDistributedObjectsStatistics

  2  61630                      -init:entry time: 28391079252640
arg0: 147840
obj: 700a1250
obj->isa: a0014780
isa: a0014780
classname: NSDistantObjectTableEntry

为什么会出现错误?好像是类名(这是唯一的%s,删除也不会报错),但为什么会认为某些类名是无效指针?

有什么方法可以让错误消息真正告诉我我的 DTrace 程序的哪一行导致了问题?

有没有办法打电话给object_getClassName 而不是做这种结构检查舞?

不管怎样,我正在跟踪的程序运行良好——它没有崩溃,所以我不相信这些类真的坏了。

【问题讨论】:

【参考方案1】:

Colin 非常接近正确。

见:

http://www.friday.com/bbum/2008/01/03/objective-c-using-dtrace-to-trace-messages-to-nil/

您很可能需要将DYLD_SHARED_REGION 环境变量设置为avoid。 dtrace 仅对实际驻留在物理内存中的映射内存真正起作用。

您可以使用vmmap 命令行工具找出缺少的内容。

生成上述失败消息后,在您的应用程序上执行vmmap PID。查看输出,看看像0x90206b98 这样的地址属于哪个区域。鉴于该地址,它可能位于不可写的共享内存块中,可能不是常驻的,因此 dtrace 无法从中读取。

【讨论】:

【参考方案2】:

当在尚未出错的页面上使用 copyin / copyinstr 时会发生此错误。一个常见的解决方法是让函数使用有问题的数据,然后在 :::return 子句中复制 [str]。例如:

syscall::open:entry

    self->filename = arg0;  /* Hang on to the file name pointer.  */


syscall::open:return
/self->filename/

    @files[copyinstr(self->filename)] = count();
    self->filename = 0;


END

    trunc(@files, 5);

【讨论】:

【参考方案3】:

我自己还没有完全追踪到这一点。 DTrace 可能正在尝试解析一些 Objective-C 符号。尽管 DTrace 是一种动态跟踪工具,但它不能很好地与 Objective-C 在运行时动态加载事物相结合。当 Objective-C 确实加载新类时,DTrace 必须解决这个问题,这需要一点时间,尤其是当您的应用程序刚刚启动时。即使它确实加载了东西,并且您的 objc 应用程序仍在将新类加载到 objc 运行时,它可能的 DTrace 可能会搞砸并以错误的顺序打印方法(如果您关心看到正在执行的正确顺序方法) ,打印不正确的计时结果等。

【讨论】:

【参考方案4】:

根据所提供的信息,这是我的最佳猜测。

DTrace 的设计目的是使 DTrace 脚本尽可能具有确定性。这就是为什么没有if 语句、循环、子例程(DTrace 本身提供的伪子例程除外)等的原因。这是因为您的 DTrace 脚本中的代码在内核模式下运行,而不是用户态的一部分被跟踪的过程。一般来说,DTrace 可以访问的信息是“只读的”(就像大多数概括一样,这不是严格正确的),能够在程序或内核中使用像 DTrace 这样强大的东西可以导致事情发生非常非常错误,非常非常快。

美元到甜甜圈,您遇到的问题是因为指针指向的页面没有被 VM 系统映射到核心。 DTrace 只能检查内核中的内存信息——它不能双重错误以使 VM 系统加载到页面中。

如果您知道类“应该”是什么并通过执行一堆引用所需类的虚拟 NSLog() 语句来强制将页面映射到核心,您可能可以帮助缓解问题在程序启动初期的某个方便的时间点。

【讨论】:

昨晚我想到了这个。 DTrace 的设计将内核中运行的“代码”数量保持在最低限度,并尽可能“安全”。符号名称解析发生在内核之外。内核仅将地址记录在缓冲区中,外部程序在事后将其转换为可读的内容。这个想法是 - 为什么不将 ObjC 类名称解析添加到这些“内核之外”活动之一?可能值得进行一些调查,看看它是否可行,然后向 Apple 报告 RFE 错误。

以上是关于为啥 DTrace 有时但并非总是给我无效地址错误?的主要内容,如果未能解决你的问题,请参考以下文章

DTrace for Linux ustack() 操作中的无效地址

Dtrace 无效的探针说明符错误

如何修复已启用探测器上的错误:无效地址 (0x0)?

Apple推送通知有时但并非总是有效

<错误>:CGContextSaveGState:无效上下文 0x0 错误

NSLocalizedString 有时会加载字符串,但并非总是如此