LLVM 的 llc 生成看似不正确的代码

LLVM's llc generates seemly incorrect code

我正在 LLVM 中编写函数传递,它生成 IR 文件。问题是 assembled 代码的行为似乎不像我预期的那样。由于我是 LLVM 的新手,我想知道我是否误解了 LLVM IR 语义,或者这是 llc 的不正确行为。

LLVM IR 是:

define void @fff(i32*) #0 {
  %2 = alloca i32*, align 8
  %3 = alloca i32, align 4
  %4 = load i8*, i8** @dirty
  br label %5

; <label>:5:                                      ; preds = %1
  store i32* %0, i32** %2, align 8
  %6 = load i32*, i32** %2, align 8
  %7 = call i32 (i8*, ...) @printf(i8* getelementptr inbounds ([11 x i8], [11 x i8]* @.str.4, i32 0, i32 0), i32* %6)
  %8 = load i32*, i32** %2, align 8
  %9 = load i32, i32* %8, align 4
  %readDirty = load atomic i8, i8* %4 acquire, align 8
  %10 = icmp eq i8 %readDirty, 1
  br i1 %10, label %Restart, label %11, !prof !3

; <label>:11:                                     ; preds = %5
  store i32 %9, i32* %3, align 4
  ret void

Restart:                                          ; preds = %5
  ;EDIT: bug was here. Must include label %5 as a possible destination block
  indirectbr i8* blockaddress(@fff, %5), []
}

这(大致)对应于以下 C 代码:

char *dirty=1; 
void fff(int *head) ATTR{
restart:
    printf("head = %p\n", head);
    int r = *head;
    if(*dirty)
        goto restart; //But using indirect branch
}

接下来我 assemble、link 和 运行 使用:

llc -filetype=obj simpleOut.ll -o out.o
gcc -o exe out.o
./exe

如果我调用地址为 0x7ffeea51d7a8 的函数,它会打印:

head = 0x7ffeea51d7a8
head = 0x2e889e825bf4005c
Segmentation fault: 11

x86_64汇编代码为:

;head reside in rcx
100000d60:  55  pushq   %rbp
100000d61:  48 89 e5    movq    %rsp, %rbp
100000d64:  53  pushq   %rbx
100000d65:  48 83 ec 18     subq    , %rsp
100000d69:  48 89 f9    movq    %rdi, %rcx
100000d6c:  48 8d 3d dd 02 00 00    leaq    733(%rip), %rdi
100000d73:  ff 17   callq   *(%rdi)
100000d75:  48 8b 18    movq    (%rax), %rbx
100000d78:  48 8d 3d c0 01 00 00    leaq    448(%rip), %rdi
100000d7f:  48 89 4d f0     movq    %rcx, -16(%rbp)
100000d83:  48 8b 75 f0     movq    -16(%rbp), %rsi
100000d87:  b0 00   movb    [=14=], %al
100000d89:  e8 62 01 00 00  callq   354 ;call to printf, corrupt rcx
100000d8e:  48 8b 45 f0     movq    -16(%rbp), %rax
100000d92:  8b 00   movl    (%rax), %eax
100000d94:  80 3b 01    cmpb    , (%rbx)
100000d97:  74 0a   je  10 <_fff+0x43>
100000d99:  89 45 ec    movl    %eax, -20(%rbp)
100000d9c:  48 83 c4 18     addq    , %rsp
100000da0:  5b  popq    %rbx
100000da1:  5d  popq    %rbp
100000da2:  c3  retq
100000da3:  48 8d 05 ce ff ff ff    leaq    -50(%rip), %rax
100000daa:  ff e0   jmpq    *%rax ;jumps to 100000d78
100000dac:  0f 1f 40 00     nopl    (%rax)

问题似乎是 LLVM 语句 store i32* %0, i32** %2, align 8 即使在重新启动后也会转换为 movq %rcx, -16(%rbp),其中寄存器 rcx 已被 printf 函数损坏。

如果这看起来像是一个错误,我将使用 LLVM 提交错误报告。只是想确认我没有误解 LLVM IR。

llc 版本为 5.0.0,通过 homebrew 安装。 gcc(用于 linking)是 clang-900.0.39.2。

谢谢

根据documentationindirectbr 指令应提供所有可能目标块的列表。省略跳转到的 BB 会产生未定义的行为。