Visual C++ 2015 中 virtual table 汇编输出的混淆

Confusion on assembly output of virtual table in Visual C++ 2015

我对 Visual C++ 2015 (x86) 的汇编输出感到困惑。

我想知道VC中的虚table布局,所以我用虚函数写了下面简单的class

#include <stdio.h>

struct Foo
{
    virtual int GetValue()
    {
        uintptr_t vtbl = *(uintptr_t *)this;
        uintptr_t slot0 = ((uintptr_t *)vtbl)[0];
        uintptr_t slot1 = ((uintptr_t *)vtbl)[1];

        printf("vtbl = 0x%08X\n", vtbl);
        printf("  [0] = 0x%08X\n", slot0);
        printf("  [1] = 0x%08X\n", slot1);

        return 0xA11BABA;
    }
};

extern "C" void Check();

int main()
{
    Foo *pFoo = new Foo;
    int x = pFoo->GetValue();
    printf("x = 0x%08X\n", x);
    printf("\n");
    Check();
}

为了检查布局,我实现了一个汇编函数(魔法名称来自 vtab.cpp 的汇编输出 vtab.asm,是 Foo::GetValue 的错位版本)。

.model flat

extern _printf : proc
extern ?GetValue@Foo@@UAEHXZ : proc

.const
FUNC_ADDR db "Address of Foo::GetValue = 0x%08X", 10, 0

.code
_Check proc
    push ebp
    mov esp, ebp

    push offset ?GetValue@Foo@@UAEHXZ
    push offset FUNC_ADDR
    call _printf
    add esp, 8

    pop ebp
    ret
_Check endp
end

然后,我编译 运行。

ml /c check.asm
cl /Fa vtab.cpp check.obj
vtab

并在我的电脑上得到以下输出。

vtbl = 0x00FF2174
  [0] = 0x00FE1300
  [1] = 0x6C627476
x = 0x0A11BABA

Address of Foo::GetValue = 0x00FE1300

它清楚地表明虚函数 GetValue 位于虚函数 table 的偏移量 0 处。但是 vtab.cpp 的汇编输出似乎暗示 GetValue 位于偏移量 4(请参阅以下注释以三个分号开头)。

;   COMDAT ??_7Foo@@6B@
CONST   SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@          ; Foo::`vftable'
    DD  FLAT:?GetValue@Foo@@UAEHXZ         ;;; GetValue at offset 4
CONST   ENDS

; Function compile flags: /Odtp
;   COMDAT ??0Foo@@QAE@XZ
_TEXT   SEGMENT
_this$ = -4                     ; size = 4
??0Foo@@QAE@XZ PROC                 ; Foo::Foo, COMDAT
; _this$ = ecx
    push    ebp
    mov ebp, esp
    push    ecx
    mov DWORD PTR _this$[ebp], ecx
    mov eax, DWORD PTR _this$[ebp]
    mov DWORD PTR [eax], OFFSET ??_7Foo@@6B@    ;;; Init ptr to virtual table
    mov eax, DWORD PTR _this$[ebp]
    mov esp, ebp
    pop ebp
    ret 0
??0Foo@@QAE@XZ ENDP                 ; Foo::Foo

感谢您的回答!

更新

@Hans Passant 这似乎是一个错误。我 ml /c 汇编输出 vtab.asm (删除了一些符号)和 link 它与 check.obj 一起得到一个 exe vtab2.exe。但是 vtab2.exe 不会 运行 正确。然后我修改如下代码

;   COMDAT ??_7Foo@@6B@
CONST   SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@          ; Foo::`vftable'
    DD  FLAT:?GetValue@Foo@@UAEHXZ
CONST   ENDS

;   COMDAT ??_7Foo@@6B@
CONST   SEGMENT
__NOT_USED_ DD  FLAT:??_R4Foo@@6B@          ; Foo::`vftable'
??_7Foo@@6B@    DD  FLAT:?GetValue@Foo@@UAEHXZ
CONST   ENDS

mllink再次得到vtab3.exe。现在 vtab3.exe 运行 正确并产生类似于 vtab.exe.

的输出

我认为 Microsoft 不会将此视为错误。是的,汇编输出应该在 vtable 的第二个元素上有 vtable 符号,以便 RTTI 条目出现在 table 的偏移量 -4 处。然而,table 也应该在 COMDAT 部分中,但在汇编输出 (; COMDAT) 中只有一条注释表明了这一点。这是因为虽然 PECOFF 目标文件格式支持 COMDAT 部分,但汇编器(MASM,调用为 ml)不支持。编译器无法生成实际对应于它创建的目标文件内容的程序集文件。

或者换句话说,汇编输出并不意味着要被汇编。它只是为了提供信息。即使应用了您的修复程序,程序集输出也不会生成与编译器相同的目标文件。如果您在一个更实际的项目中执行此操作,其中 Foo 在多个目标文件中使用,您将在链接时遇到多个定义错误。如果你想看到编译器的真实输出,你需要查看目标文件。

例如,如果您使用 dumpbin /all vtab.obj 并查看它的输出,您会看到如下内容:

SECTION HEADER #C
  .rdata name
...
40301040 flags
         Initialized Data
         COMDAT; sym= "const Foo::`vftable'" (??_7Foo@@6B@)
         4 byte align
         Read Only

RAW DATA #C
  00000000: 00 00 00 00 00 00 00 00                          ........

RELOCATIONS #C
                                                Symbol    Symbol
 Offset    Type              Applied To         Index     Name
 --------  ----------------  -----------------  --------  ------
 00000000  DIR32                      00000000        34  ??_R4Foo@@6B@ (const Foo::`RTTI Complete Object Locator')
 00000004  DIR32                      00000000        1F  ?GetValue@Foo@@UAEHXZ (public: virtual int __thiscall Foo::GetValue(void))

...

COFF SYMBOL TABLE
...
026 00000000 SECTC  notype       Static       | .rdata
    Section length    8, #relocs    2, #linenums    0, checksum        0, selection    6 (pick largest)
028 00000004 SECTC  notype       External     | ??_7Foo@@6B@ (const Foo::`vftable')

不是很容易理解,但是给出了有关vtable实际布局的所有信息。 vtable、??_7Foo@@6B@ (const Foo::`vftable') 的符号位于 SECTC 的偏移量 00000004 或节号 0xC 处。 #C 部分长 8 个字节,并具有 RTTI 定位器和 Foo::GetValue 的重定位,这些重定位应用于该部分的偏移量 0000000000000004。所以你可以看到在目标文件中 vtable 符号实际上指向包含指向第一个虚方法的指针的条目。

Open Watcom 有一个实用程序,可以以更类似于程序集的方式向您显示目标文件的内容,但值得注意的是,它不是 MASM 使用的语法。 运行 wdis t279.obj 显示:

                .new_section .rdata, "dr2"
0000    00 00 00 00                                     .long   ??_R4Foo@@6B@
0004                          ??_7Foo@@6B@:
0004    00 00 00 00                                     .long   ?GetValue@Foo@@UAEHXZ