LLVM 解释器在哪里寻找外部函数(库?)

Where LLVM interpreter is looking for external functions (libraries?)

我正在玩 LLVM IR,我无法解决(在 google 和文档的帮助下)LLVM 解释器 lli 正在寻找外部(未明确定义的函数。我的意思是基本的系统功能)。例如,如果我想编写没有依赖关系的简单程序,在 linux 上会在屏幕上写一些东西,我可以这样做:

@message = private constant [12 x i8] c"hello world[=10=]A"
define i32 @puts(i8* %s) {
    call i32 asm sideeffect "movl $[=10=]x2, %edi[=10=]Amovl $[=10=]xC, %edx[=10=]Amovl$, %eax[=10=]Asyscall[=10=]A", "=A,{si}"(i8* %s) #1
    ret i32 %1
}
define void @exit(i32 %c) {
    call i32 asm sideeffect "movl $, %eax[=10=]Asyscall[=10=]A", "=A,{di}"(i32 %c) #1
    ret void
}
define void @main() {
    getelementptr [12 x i8], [12 x i8]* @message, i64 0, i64 0
    call i32 @puts(i8* %1)
    call void @exit(i32 0)
    ret void
}
define void @_start() {
    call void @main()
    ret void
}

main_start 是为了与 ldlli 交叉兼容。所以上面的代码在两者中都是一样的。我可以 lli 这个,代码将从 main 开始,或者 llc 然后 ld 它也可以工作,因此代码将从 _start 开始预期的。现在如果我写代码:

@formatString = private constant [4 x i8] c"%d[=11=]A[=11=]" 
declare i32 @printf(i8*, ...)
define i32 @main() {
    %d = shl i32 2, 3
    %s = getelementptr [4 x i8], [4 x i8]* @formatString, i64 0, i64 0
    %call = call i32 (i8*, ...) @printf(i8* %s, i32 %d)
    ret i32 0
}

它也适用于 lli 但我不能 ld 因为 ld 不知道对 printf 的引用,这也是预期的。我可以包含 prepare ld 参数以使该代码也能正常工作,或者简单地使用 gcc file.o -o file,但这不是我的观点。我的观点是如何使 lli 不包含任何外部库(如 libc),只包含 运行 我的代码,并且可能定义我自己的入口点,这样我就可以包含任何准备好的 libc 或任何其他库,我知道我可以覆盖函数的名称并且应该可以工作,但是我不能确定重写了什么,所以如果 lli 抛出错误如果 printf 使用但未定义。或者我弄错了,lli 无法在这样的裸环境中执行。

TL;DR:在没有 JIT 的情况下使用 lli,可能会工作:

lli -force-interpreter main.bc

更多信息:

一般来说,这取决于您在后台使用的 JIT 引擎类型(如果有的话)。

我不能谈论 MCJIT (-jit-kind=mcjit) 因为我不熟悉它,但我可以向你保证,如果你使用 ORC JIT (-jit-kind=orc-mcjit-jit-kind=orc-lazy).但是,这仅适用于 lli,如果您决定自己使用 ORC,则可以控制此行为。

lli 的上下文中,ORC 不仅会加载您的 module/external 对象,还会加载整个程序的地址 space。这意味着您获得了所有的 libc 和整个 LLVM 本身。

根据您的需要,您可以尝试使用 lli 真正作为解释器,但由于不再涉及 JIT,它会更慢。

只需添加 -force-interpreter 选项,您就可以开始了,除了少数例外。这些功能仍然会正常执行:

void Interpreter::initializeExternalFunctions() {
  sys::ScopedLock Writer(*FunctionsLock);
  (*FuncNames)["lle_X_atexit"]       = lle_X_atexit;
  (*FuncNames)["lle_X_exit"]         = lle_X_exit;
  (*FuncNames)["lle_X_abort"]        = lle_X_abort;

  (*FuncNames)["lle_X_printf"]       = lle_X_printf;
  (*FuncNames)["lle_X_sprintf"]      = lle_X_sprintf;
  (*FuncNames)["lle_X_sscanf"]       = lle_X_sscanf;
  (*FuncNames)["lle_X_scanf"]        = lle_X_scanf;
  (*FuncNames)["lle_X_fprintf"]      = lle_X_fprintf;
  (*FuncNames)["lle_X_memset"]       = lle_X_memset;
  (*FuncNames)["lle_X_memcpy"]       = lle_X_memcpy;
}