Clang 在发出 LLVM IR 时向所有函数添加 noinline 属性
Clang adds noinline attribute to all functions when emitting LLVM IR
考虑以下简单函数:
int foo() { return 42; }
通过 clang -emit-llvm -S foo.cpp
将其编译为 LLVM 会生成以下模块:
; ModuleID = 'foo.cpp'
source_filename = "foo.cpp"
target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-apple-macosx10.13.0"
; Function Attrs: noinline nounwind ssp uwtable
define i32 @_Z3foov() #0 {
ret i32 42
}
attributes #0 = { noinline nounwind ssp uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="penryn" "target-features"="+cx16,+fxsr,+mmx,+sse,+sse2,+sse3,+sse4.1,+ssse3,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
!llvm.module.flags = !{!0}
!llvm.ident = !{!1}
!0 = !{i32 1, !"PIC Level", i32 2}
!1 = !{!"Apple LLVM version 9.0.0 (clang-900.0.37)"}
为什么 foo
函数声明为 noinline
?如果指定了优化级别(-O0
除外),则不会添加该标志,但我想避免这种情况。
还有其他方法/标志吗?
使用-O0,你不能启用全局内联,从Clang的源代码来看
(Frontend\CompilerInvocation.cpp
):
// At O0 we want to fully disable inlining outside of cases marked with
// 'alwaysinline' that are required for correctness.
Opts.setInlining((Opts.OptimizationLevel == 0)
? CodeGenOptions::OnlyAlwaysInlining
: CodeGenOptions::NormalInlining);
根据您的要求,您可以:
- 使用
-O1
,最接近-O0
。
- 结合使用
-O1
和禁用它启用的优化标志。有关使用 -O1
启用的优化标志,请参阅以下答案:Clang optimization levels
- 有选择地对应内联的函数应用
always_inline
属性。
例如:int __attribute__((always_inline)) foo() { return 42; }
考虑以下简单函数:
int foo() { return 42; }
通过 clang -emit-llvm -S foo.cpp
将其编译为 LLVM 会生成以下模块:
; ModuleID = 'foo.cpp'
source_filename = "foo.cpp"
target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-apple-macosx10.13.0"
; Function Attrs: noinline nounwind ssp uwtable
define i32 @_Z3foov() #0 {
ret i32 42
}
attributes #0 = { noinline nounwind ssp uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="penryn" "target-features"="+cx16,+fxsr,+mmx,+sse,+sse2,+sse3,+sse4.1,+ssse3,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
!llvm.module.flags = !{!0}
!llvm.ident = !{!1}
!0 = !{i32 1, !"PIC Level", i32 2}
!1 = !{!"Apple LLVM version 9.0.0 (clang-900.0.37)"}
为什么 foo
函数声明为 noinline
?如果指定了优化级别(-O0
除外),则不会添加该标志,但我想避免这种情况。
还有其他方法/标志吗?
使用-O0,你不能启用全局内联,从Clang的源代码来看
(Frontend\CompilerInvocation.cpp
):
// At O0 we want to fully disable inlining outside of cases marked with
// 'alwaysinline' that are required for correctness.
Opts.setInlining((Opts.OptimizationLevel == 0)
? CodeGenOptions::OnlyAlwaysInlining
: CodeGenOptions::NormalInlining);
根据您的要求,您可以:
- 使用
-O1
,最接近-O0
。 - 结合使用
-O1
和禁用它启用的优化标志。有关使用-O1
启用的优化标志,请参阅以下答案:Clang optimization levels - 有选择地对应内联的函数应用
always_inline
属性。
例如:int __attribute__((always_inline)) foo() { return 42; }