为什么 ESP 指向 [esp+0xc]?

Why does ESP point to [esp+0xc]?

我想学习一些汇编,现在我有一个问题 ESP 在主函数的函数调用期间将初始化的整数移动到。

C 代码:

#include<stdio.h>


int main() {
    int hallo = 5;
}

当我用GCC编译这个文件并用命令反编译它时 objdump -M intel -D a.exe | grep -A20 main.

然后看起来像这样:

00401460 <_main>:
  401460:       55                      push   ebp
  401461:       89 e5                   mov    ebp,esp
  401463:       83 e4 f0                and    esp,0xfffffff0
  401466:       83 ec 10                sub    esp,0x10
  401469:       e8 42 05 00 00          call   4019b0 <___main>
  40146e:       c7 44 24 0c 05 00 00    mov    DWORD PTR [esp+0xc],0x5
  401475:       00
  401476:       b8 00 00 00 00          mov    eax,0x0
  40147b:       c9                      leave
  40147c:       c3                      ret
  40147d:       90                      nop
  40147e:       90                      nop
  40147f:       90                      nop

00401480 <__setargv>:
  401480:       55                      push   ebp
  401481:       89 e5                   mov    ebp,esp
  401483:       57                      push   edi
  401484:       56                      push   esi
  401485:       53                      push   ebx
--
004019b0 <___main>:
  4019b0:       a1 28 70 40 00          mov    eax,ds:0x407028
  4019b5:       85 c0                   test   eax,eax
  4019b7:       74 07                   je     4019c0 <___main+0x10>
  4019b9:       f3 c3                   repz ret
  4019bb:       90                      nop
  4019bc:       8d 74 26 00             lea    esi,[esi+eiz*1+0x0]
  4019c0:       c7 05 28 70 40 00 01    mov    DWORD PTR ds:0x407028,0x1
  4019c7:       00 00 00
  4019ca:       eb 94                   jmp    401960 <___do_global_ctors>
  4019cc:       90                      nop
  4019cd:       90                      nop
  4019ce:       90                      nop
  4019cf:       90                      nop

004019d0 <.text>:
  4019d0:       83 ec 1c                sub    esp,0x1c
  4019d3:       8b 44 24 24             mov    eax,DWORD PTR [esp+0x24]
  4019d7:       83 f8 03                cmp    eax,0x3
  4019da:       74 14                   je     4019f0 <.text+0x20>
  4019dc:       85 c0                   test   eax,eax

我希望最后的汇编命令是 mov DWORD PTR [esp+0xF],0x5, 因为堆栈是从上到下增长的,并且由于 Little Endian,ESP 必须位于 [esp+0xF] 以填充下一个 4 字节(整数)到位置 [esp+0xc].

不,[esp+0xF] 的双字存储会在 [esp + 0x0f .. 0x12] 写入 4 个字节,这甚至不是 dword-aligned。

如果您对 Relation between endianness and stack-growth direction 和那里的旧答案感到困惑,那是可以理解的;他们完全错了,所以我发布了一个正确的。

双字的地址始终是其任何组成字节的最低地址。(这适用于大系统和 little-endian 系统)。

Reserving 16 bytes and storing to [esp+0xc] 存储到那 16.highest-address 的 4 个字节。

[esp+0xc] 处的双字是(从 LSB 到 MSB 的顺序)地址 ESP +0xc+0xd+0xe 处的字节和 +0xf.

对于(假设的)big-endian x86,它将是相同的字节,但顺序是 MSB 到 LSB。双字的地址仍然是 [esp+0xc].

None 这与 pushesp-=4 而不是 esp+=4 有任何联系。具有 upwards-growing 堆栈的系统仍然使用字/双字中的最低字节地址作为该 multi-byte 整数的地址。就像在 C 中一样,数组或结构的地址是第一个元素的地址。事实上,这就是 为什么 C 地址以这种方式工作。


由于堆栈向下增长,gcc 会选择在保存的 EBP 值正下方放置一个局部变量,而让 space 的其余部分未用作堆栈对齐之前的填充,这是有道理的a call(CRT 辅助函数 ___main)。

即使 32 位 Windows ABI 不需要 16 字节堆栈对齐,gcc 还是选择这样做(-mpreferred-stack-boundary=4 的默认值:2^4 = 16)


顺便说一句,如果您在启用优化的情况下进行编译,显然所有这些噪音都会消失。那么main就可以ret了。或者也许仍然需要调用 ___main,但可以优化掉本地。

您可以减少噪音,但仍然可以通过将 GCC 设置为 volatile 并使用 -O3 进行编译来使 GCC 初始化为本地。或者将其地址传递给另一个 non-inline 函数。


Why does ESP point to [esp+0xc]?

嗯?那甚至没有意义。 ESP 指向 [esp]。您实际上是在问为什么 GCC 选择使用寻址模式 [esp+0xc] 而不是其他一些位移。