printf() 在 x86-64 平台上给出相同的输出,即使在交换参数时也是如此

printf() giving identical output on x86-64 platforms even when arguments are swapped

考虑以下代码:

#include <stdio.h>

int main() {
    printf("%lf %ld\n", 1234.0, 5678L);
    printf("%lf %ld\n", 5678L, 1234.0);
}

printf 的两次调用都打印相同的文本 1234.000000 5678,这与第二次调用的代码不太匹配(可能应该是 5678.0000 1234)。

我在 x86-64 处理器上 Linux 4.x,但我无法在 x86(32 位)上重现它。我想它可以在 amd64 架构的任何 Linux 系统上重现。

为什么交换参数为 printf 提供相同的输出,为什么它特定于 x86-64?

答案是因为它是 System V ABI x86-64 定义参数传递方式的方式。

根据PDF第22页,前6个整数参数在%rdi、%rsi、%rdx、%rcx、%r8、%r9上传递,前8个浮点参数是从 %xmm0 传递到 %xmm7。但是,整数和浮点数之间没有特定的顺序。因此,以下两个函数,尽管定义不同,但行为相同。

int f1(int i1, int i2, int i3, double d1, double d2, double d3);
int f2(double d1, double d2, int i1, int i2, double d3, int i3);

按照 Syetem V x86-64 ABI 编译,这两个函数将在寄存器 %rdi、%rsi 和 %rdx 中接收 i1、i2 和 i3,在寄存器 %xmm0、%xmm1 中接收 d1、d2 和 d3, %xmm2.

可变参数也不例外。最多 6 个整数和最多 8 个浮点数通过寄存器传递,其余在堆栈上传递。

说到这段具体的代码,通过查看gcc -O0 -S生成的汇编代码,我验证了上面的说法:整数5678通过%rsi发送给printf,(双精度)浮点数-点值 1234.0 通过 %xmm0 发送到 printf。在这两种情况下,%eax 都设置为 1,表示有一个浮点参数可用。

哦,是的,%rdi 在哪里?实际上,格式化字符串是第一个参数,因此指向字符串的指针是通过 %rdi 传递的。

printf 不知道整数是在浮点数之前还是相反,它只知道它有一个整数参数(在格式化字符串之后)和一个浮点数点参数(读 %al)。这正是两条线产生相同输出的原因。

TODO:有人在这里放了神箭 link 吗?