bug诞生记——const_cast引发只读数据区域写违例

Posted breaksoftware

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bug诞生记——const_cast引发只读数据区域写违例相关的知识,希望对你有一定的参考价值。

        对于C++这种强类型的语言,明确的类型既带来了执行的高效,又让错误的发生提前到编译期。所以像const这类体现设计者意图的关键字,可以隐性的透露给我们它描述的对象的使用边界。它是我们的朋友,我们要学会和它相处,而不是改变它。(转载请指明出于breaksoftware的csdn博客)

        我们来看一个试图改变这个好朋友的案例

class Base 
public:
    Base() : _name("Base") 
    

    const char* get_name() const 
        return _name;
    
private:
    const char _name[32];
;

        Base类有个get_name方法返回了一个const char*。它返回的是该类的成员变量_name——即类名"base"。

        现在有个同学试图继承该类,于是他增加了如下代码

class Derive : public Base 
public:
    Derive() 
        const char* base_name = Base::get_name();
        strcpy(const_cast<char*>(base_name), "Derive");
    
;

        Derive的构造函数调用了Base的get_name方法获取了一个const char*变量base_name。他试图去修改这个地址空间的数据,让其填充自己类的名称"Derive"。由于strcpy需要第一个参数是char*型的,于是他使用const_cast关键字“剥夺”了base_name的const属性,让编译通过。

        目前这段代码还可以正确执行,但是之后一个同学对Base类的优化,将彻底触发修改const属性引发的灾难。

class Base 
public:
    const char* get_name() const 
        return _name;
    
private:
    const char* _name = "Base";

        这样编译出来的代码,最终在执行期会崩溃。

        先分析Base的get_name方法的反汇编代码

push    ebp
mov     ebp, esp
sub     esp, 0CCh
push    ebx
push    esi
push    edi
push    ecx
lea     edi, [ebp+var_CC]
mov     ecx, 33h
mov     eax, 0CCCCCCCCh
rep stosd
pop     ecx
mov     [ebp+var_8], ecx
mov     eax, [ebp+var_8]
mov     dword ptr [eax], offset aBase ; "Base"
mov     eax, [ebp+var_8]
pop     edi
pop     esi
pop     ebx
mov     esp, ebp
pop     ebp
retn

        第15行将"Base"字符串的地址保存到寄存器eax指向的地址空间中。之后该方法返回

push    offset Source   ; "Derive"
mov     eax, [ebp+Dest]
push    eax             ; Dest
call    j_strcpy_0

        调用了strcpy方法,其中eax还是"Base"字符串的首地址。

        崩溃出现在strcpy方法中,出错的地址也是“Base"字符串的首地址。

        为什么写这个地址会出错,我们看下get_name中aBase的地址

.rdata:0041DB30 aBase           db 'Base',0             ; DATA XREF: sub_412460+26↑o
.rdata:0041DB35                 db    0
.rdata:0041DB36                 db    0
.rdata:0041DB37                 db    0
.rdata:0041DB38                 db    0

        可以见到这个地址保存在rdata区域。rdata是readonly-data的意思,即这块地址空间是只读的,所以往其中写数据会报错。

        由于我们在修改后的Base类中,让成员变量_name指向了一个字面量。这个字面量作为常量,它会保存在PE/ELF文件的只读数据区域。关于什么信息会保存在只读区域,以及还有什么其他区域,大家可以在网上搜索PE/ELF文件格式的说明。

        最后从语义角度来说,可以认为Derive的作者违背了编译器对关键字const的约束,即违背了一种约定导致的。所以我们尽量别用const_cast这种试图绕过编译器的“小聪明”手段。

以上是关于bug诞生记——const_cast引发只读数据区域写违例的主要内容,如果未能解决你的问题,请参考以下文章

bug诞生记——临时变量栈变量导致的双杀

bug诞生记——不定长参数隐藏的类型问题

bug诞生记——不定长参数隐藏的类型问题

bug诞生记——信号(signal)处理导致死锁

bug诞生记——信号(signal)处理导致死锁

记一个WINDOWS命令行引发的BUG