Visual C++ 2015 中 virtual table 汇编输出的混淆
Confusion on assembly output of virtual table in Visual C++ 2015
我对 Visual C++ 2015 (x86) 的汇编输出感到困惑。
我想知道VC中的虚table布局,所以我用虚函数写了下面简单的class
#include <stdio.h>
struct Foo
{
virtual int GetValue()
{
uintptr_t vtbl = *(uintptr_t *)this;
uintptr_t slot0 = ((uintptr_t *)vtbl)[0];
uintptr_t slot1 = ((uintptr_t *)vtbl)[1];
printf("vtbl = 0x%08X\n", vtbl);
printf(" [0] = 0x%08X\n", slot0);
printf(" [1] = 0x%08X\n", slot1);
return 0xA11BABA;
}
};
extern "C" void Check();
int main()
{
Foo *pFoo = new Foo;
int x = pFoo->GetValue();
printf("x = 0x%08X\n", x);
printf("\n");
Check();
}
为了检查布局,我实现了一个汇编函数(魔法名称来自 vtab.cpp
的汇编输出 vtab.asm
,是 Foo::GetValue
的错位版本)。
.model flat
extern _printf : proc
extern ?GetValue@Foo@@UAEHXZ : proc
.const
FUNC_ADDR db "Address of Foo::GetValue = 0x%08X", 10, 0
.code
_Check proc
push ebp
mov esp, ebp
push offset ?GetValue@Foo@@UAEHXZ
push offset FUNC_ADDR
call _printf
add esp, 8
pop ebp
ret
_Check endp
end
然后,我编译 运行。
ml /c check.asm
cl /Fa vtab.cpp check.obj
vtab
并在我的电脑上得到以下输出。
vtbl = 0x00FF2174
[0] = 0x00FE1300
[1] = 0x6C627476
x = 0x0A11BABA
Address of Foo::GetValue = 0x00FE1300
它清楚地表明虚函数 GetValue
位于虚函数 table 的偏移量 0 处。但是 vtab.cpp
的汇编输出似乎暗示 GetValue
位于偏移量 4(请参阅以下注释以三个分号开头)。
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
DD FLAT:?GetValue@Foo@@UAEHXZ ;;; GetValue at offset 4
CONST ENDS
; Function compile flags: /Odtp
; COMDAT ??0Foo@@QAE@XZ
_TEXT SEGMENT
_this$ = -4 ; size = 4
??0Foo@@QAE@XZ PROC ; Foo::Foo, COMDAT
; _this$ = ecx
push ebp
mov ebp, esp
push ecx
mov DWORD PTR _this$[ebp], ecx
mov eax, DWORD PTR _this$[ebp]
mov DWORD PTR [eax], OFFSET ??_7Foo@@6B@ ;;; Init ptr to virtual table
mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret 0
??0Foo@@QAE@XZ ENDP ; Foo::Foo
感谢您的回答!
更新
@Hans Passant 这似乎是一个错误。我 ml /c
汇编输出 vtab.asm
(删除了一些符号)和 link 它与 check.obj
一起得到一个 exe vtab2.exe
。但是 vtab2.exe
不会 运行 正确。然后我修改如下代码
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
DD FLAT:?GetValue@Foo@@UAEHXZ
CONST ENDS
到
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
__NOT_USED_ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
??_7Foo@@6B@ DD FLAT:?GetValue@Foo@@UAEHXZ
CONST ENDS
和ml
和link
再次得到vtab3.exe
。现在 vtab3.exe
运行 正确并产生类似于 vtab.exe
.
的输出
我认为 Microsoft 不会将此视为错误。是的,汇编输出应该在 vtable 的第二个元素上有 vtable 符号,以便 RTTI 条目出现在 table 的偏移量 -4 处。然而,table 也应该在 COMDAT 部分中,但在汇编输出 (; COMDAT
) 中只有一条注释表明了这一点。这是因为虽然 PECOFF 目标文件格式支持 COMDAT 部分,但汇编器(MASM,调用为 ml
)不支持。编译器无法生成实际对应于它创建的目标文件内容的程序集文件。
或者换句话说,汇编输出并不意味着要被汇编。它只是为了提供信息。即使应用了您的修复程序,程序集输出也不会生成与编译器相同的目标文件。如果您在一个更实际的项目中执行此操作,其中 Foo
在多个目标文件中使用,您将在链接时遇到多个定义错误。如果你想看到编译器的真实输出,你需要查看目标文件。
例如,如果您使用 dumpbin /all vtab.obj
并查看它的输出,您会看到如下内容:
SECTION HEADER #C
.rdata name
...
40301040 flags
Initialized Data
COMDAT; sym= "const Foo::`vftable'" (??_7Foo@@6B@)
4 byte align
Read Only
RAW DATA #C
00000000: 00 00 00 00 00 00 00 00 ........
RELOCATIONS #C
Symbol Symbol
Offset Type Applied To Index Name
-------- ---------------- ----------------- -------- ------
00000000 DIR32 00000000 34 ??_R4Foo@@6B@ (const Foo::`RTTI Complete Object Locator')
00000004 DIR32 00000000 1F ?GetValue@Foo@@UAEHXZ (public: virtual int __thiscall Foo::GetValue(void))
...
COFF SYMBOL TABLE
...
026 00000000 SECTC notype Static | .rdata
Section length 8, #relocs 2, #linenums 0, checksum 0, selection 6 (pick largest)
028 00000004 SECTC notype External | ??_7Foo@@6B@ (const Foo::`vftable')
不是很容易理解,但是给出了有关vtable实际布局的所有信息。 vtable、??_7Foo@@6B@ (const Foo::`vftable')
的符号位于 SECTC
的偏移量 00000004
或节号 0xC 处。 #C 部分长 8 个字节,并具有 RTTI 定位器和 Foo::GetValue
的重定位,这些重定位应用于该部分的偏移量 00000000
和 00000004
。所以你可以看到在目标文件中 vtable 符号实际上指向包含指向第一个虚方法的指针的条目。
Open Watcom 有一个实用程序,可以以更类似于程序集的方式向您显示目标文件的内容,但值得注意的是,它不是 MASM 使用的语法。 运行 wdis t279.obj
显示:
.new_section .rdata, "dr2"
0000 00 00 00 00 .long ??_R4Foo@@6B@
0004 ??_7Foo@@6B@:
0004 00 00 00 00 .long ?GetValue@Foo@@UAEHXZ
我对 Visual C++ 2015 (x86) 的汇编输出感到困惑。
我想知道VC中的虚table布局,所以我用虚函数写了下面简单的class
#include <stdio.h>
struct Foo
{
virtual int GetValue()
{
uintptr_t vtbl = *(uintptr_t *)this;
uintptr_t slot0 = ((uintptr_t *)vtbl)[0];
uintptr_t slot1 = ((uintptr_t *)vtbl)[1];
printf("vtbl = 0x%08X\n", vtbl);
printf(" [0] = 0x%08X\n", slot0);
printf(" [1] = 0x%08X\n", slot1);
return 0xA11BABA;
}
};
extern "C" void Check();
int main()
{
Foo *pFoo = new Foo;
int x = pFoo->GetValue();
printf("x = 0x%08X\n", x);
printf("\n");
Check();
}
为了检查布局,我实现了一个汇编函数(魔法名称来自 vtab.cpp
的汇编输出 vtab.asm
,是 Foo::GetValue
的错位版本)。
.model flat
extern _printf : proc
extern ?GetValue@Foo@@UAEHXZ : proc
.const
FUNC_ADDR db "Address of Foo::GetValue = 0x%08X", 10, 0
.code
_Check proc
push ebp
mov esp, ebp
push offset ?GetValue@Foo@@UAEHXZ
push offset FUNC_ADDR
call _printf
add esp, 8
pop ebp
ret
_Check endp
end
然后,我编译 运行。
ml /c check.asm
cl /Fa vtab.cpp check.obj
vtab
并在我的电脑上得到以下输出。
vtbl = 0x00FF2174
[0] = 0x00FE1300
[1] = 0x6C627476
x = 0x0A11BABA
Address of Foo::GetValue = 0x00FE1300
它清楚地表明虚函数 GetValue
位于虚函数 table 的偏移量 0 处。但是 vtab.cpp
的汇编输出似乎暗示 GetValue
位于偏移量 4(请参阅以下注释以三个分号开头)。
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
DD FLAT:?GetValue@Foo@@UAEHXZ ;;; GetValue at offset 4
CONST ENDS
; Function compile flags: /Odtp
; COMDAT ??0Foo@@QAE@XZ
_TEXT SEGMENT
_this$ = -4 ; size = 4
??0Foo@@QAE@XZ PROC ; Foo::Foo, COMDAT
; _this$ = ecx
push ebp
mov ebp, esp
push ecx
mov DWORD PTR _this$[ebp], ecx
mov eax, DWORD PTR _this$[ebp]
mov DWORD PTR [eax], OFFSET ??_7Foo@@6B@ ;;; Init ptr to virtual table
mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret 0
??0Foo@@QAE@XZ ENDP ; Foo::Foo
感谢您的回答!
更新
@Hans Passant 这似乎是一个错误。我 ml /c
汇编输出 vtab.asm
(删除了一些符号)和 link 它与 check.obj
一起得到一个 exe vtab2.exe
。但是 vtab2.exe
不会 运行 正确。然后我修改如下代码
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
??_7Foo@@6B@ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
DD FLAT:?GetValue@Foo@@UAEHXZ
CONST ENDS
到
; COMDAT ??_7Foo@@6B@
CONST SEGMENT
__NOT_USED_ DD FLAT:??_R4Foo@@6B@ ; Foo::`vftable'
??_7Foo@@6B@ DD FLAT:?GetValue@Foo@@UAEHXZ
CONST ENDS
和ml
和link
再次得到vtab3.exe
。现在 vtab3.exe
运行 正确并产生类似于 vtab.exe
.
我认为 Microsoft 不会将此视为错误。是的,汇编输出应该在 vtable 的第二个元素上有 vtable 符号,以便 RTTI 条目出现在 table 的偏移量 -4 处。然而,table 也应该在 COMDAT 部分中,但在汇编输出 (; COMDAT
) 中只有一条注释表明了这一点。这是因为虽然 PECOFF 目标文件格式支持 COMDAT 部分,但汇编器(MASM,调用为 ml
)不支持。编译器无法生成实际对应于它创建的目标文件内容的程序集文件。
或者换句话说,汇编输出并不意味着要被汇编。它只是为了提供信息。即使应用了您的修复程序,程序集输出也不会生成与编译器相同的目标文件。如果您在一个更实际的项目中执行此操作,其中 Foo
在多个目标文件中使用,您将在链接时遇到多个定义错误。如果你想看到编译器的真实输出,你需要查看目标文件。
例如,如果您使用 dumpbin /all vtab.obj
并查看它的输出,您会看到如下内容:
SECTION HEADER #C
.rdata name
...
40301040 flags
Initialized Data
COMDAT; sym= "const Foo::`vftable'" (??_7Foo@@6B@)
4 byte align
Read Only
RAW DATA #C
00000000: 00 00 00 00 00 00 00 00 ........
RELOCATIONS #C
Symbol Symbol
Offset Type Applied To Index Name
-------- ---------------- ----------------- -------- ------
00000000 DIR32 00000000 34 ??_R4Foo@@6B@ (const Foo::`RTTI Complete Object Locator')
00000004 DIR32 00000000 1F ?GetValue@Foo@@UAEHXZ (public: virtual int __thiscall Foo::GetValue(void))
...
COFF SYMBOL TABLE
...
026 00000000 SECTC notype Static | .rdata
Section length 8, #relocs 2, #linenums 0, checksum 0, selection 6 (pick largest)
028 00000004 SECTC notype External | ??_7Foo@@6B@ (const Foo::`vftable')
不是很容易理解,但是给出了有关vtable实际布局的所有信息。 vtable、??_7Foo@@6B@ (const Foo::`vftable')
的符号位于 SECTC
的偏移量 00000004
或节号 0xC 处。 #C 部分长 8 个字节,并具有 RTTI 定位器和 Foo::GetValue
的重定位,这些重定位应用于该部分的偏移量 00000000
和 00000004
。所以你可以看到在目标文件中 vtable 符号实际上指向包含指向第一个虚方法的指针的条目。
Open Watcom 有一个实用程序,可以以更类似于程序集的方式向您显示目标文件的内容,但值得注意的是,它不是 MASM 使用的语法。 运行 wdis t279.obj
显示:
.new_section .rdata, "dr2"
0000 00 00 00 00 .long ??_R4Foo@@6B@
0004 ??_7Foo@@6B@:
0004 00 00 00 00 .long ?GetValue@Foo@@UAEHXZ