将 OpenMP 与 clang 一起使用

Using OpenMP with clang

我在使用 clang(3.6 和 3.8 ToT)编译 OpenMP 代码时遇到问题。

我关注了这个博客post http://blog.llvm.org/2015/05/openmp-support_22.html,但问题是编译后的程序只在一个线程上执行。 我正在使用 ubuntu 15.04 x64,我同时安装了 libgomp 和 libiopmp,并使用以下命令编译我的代码:

clang test.c -o test -fopenmp -L/usr/lib/gcc/x86_64-linux-gnu/5.1.1

当我改用 gcc 时,一切正常:gcc test.c -o test -fopenmp

我也试过 运行 export LD_LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/5.1.1:$LD_LIBRARY_PATH 但没有用。 `

有什么建议吗?

OMP_NUM_THREADS 环境变量可能就是你想要的。您也可以通过编程方式设置它。

https://gcc.gnu.org/onlinedocs/libgomp/Environment-Variables.html

clang 也一样。

更新

构建 LLVM/Clang (clang-3.8) 的最新主干,安装 libiomp5,并指定 gomp omp 头文件的位置。请注意,libiomp5 的 Ubuntu 包不太正确,因此您需要在 /usr/lib 中添加一个从 /usr/lib/libiomp5.so 到 /usr/lib/ 的符号链接libiomp5.so.5.

./clang++ -I/usr/lib/gcc/x86_64-linux-gnu/4.9/include -fopenmp=libiomp5 -o test test.cpp

我在 Linux Mint 17.2(本质上 Ubuntu 可靠)上使用 g++-5.1 和 clang++-3.6,我用以下代码看到相同的结果。

#include <iostream>
#include <omp.h>
int main() {
    #pragma omp parallel num_threads(4)
    {
        #pragma omp critical
        std::cout << "tid = " << omp_get_thread_num() << std::endl;
    }
}

运行 ltrace 下的这个揭示了问题:

g++

$ g++ -fopenmp -o test test.cpp
$ ./test
tid = 0
tid = 3
tid = 2
tid = 1
$ ltrace ./test
__libc_start_main(0x400af6, 1, 0x7ffc937b8198, 0x400bc0 <unfinished ...>
_ZNSt8ios_base4InitC1Ev(0x6021b1, 0xffff, 0x7ffc937b81a8, 5)   = 0
__cxa_atexit(0x4009f0, 0x6021b1, 0x602090, 0x7ffc937b7f70)     = 0
GOMP_parallel(0x400b6d, 0, 4, 0 <unfinished ...>
GOMP_critical_start(0, 128, 0, 0)                              = 0
tid = 3
tid = 2
omp_get_thread_num(0x7f9fe13894a8, 1, 0, 0x493e0)              = 0
_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc(0x6020a0, 0x400c44, 0, 0x493e0) = 0x6020a0
_ZNSolsEi(0x6020a0, 0, 0x7f9fe1a03988, 0x203d2064)             = 0x6020a0
_ZNSolsEPFRSoS_E(0x6020a0, 0x400920, 0x7f9fe1a03988, 0 <unfinished ...>
_ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_(0x6020a0, 0x400920, 0x7f9fe1a03988, 0) = 0x6020a0
<... _ZNSolsEPFRSoS_E resumed> )                               = 0x6020a0
GOMP_critical_end(0x7f9fe0d2d400, 0x7f9fe0d2e9e0, 0, -1)       = 0
tid = 1
tid = 0
<... GOMP_parallel resumed> )                                  = 0
_ZNSt8ios_base4InitD1Ev(0x6021b1, 0, 224, 0x7f9fe0d2df50)      = 0x7f9fe1a08940
+++ exited (status 0) +++

铿锵

$ clang++ -fopenmp -o test test.cpp
$ ./test
tid = 0
$ ltrace ./test
__libc_start_main(0x4009a0, 1, 0x7ffde4782538, 0x400a00 <unfinished ...>
_ZNSt8ios_base4InitC1Ev(0x6013f4, 0x7ffde4782538, 0x7ffde4782548, 5) = 0
__cxa_atexit(0x400830, 0x6013f4, 0x6012c8, 0x7ffde4782310)     = 0
_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc(0x6012e0, 0x400a84, 0x7ffde4782548, 6) = 0x6012e0
omp_get_thread_num(0x7f3e4698c006, 0x7f3e4698c000, 0x7f3e46764988, 1024) = 0
_ZNSolsEi(0x6012e0, 0, 0x7f3e46764988, 1024)                   = 0x6012e0
_ZNSolsEPFRSoS_E(0x6012e0, 0x4007a0, 0x7f3e46764988, 0 <unfinished ...>
_ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_(0x6012e0, 0x4007a0, 0x7f3e46764988, 0) = 0x6012e0
tid = 0
<... _ZNSolsEPFRSoS_E resumed> )                               = 0x6012e0
_ZNSt8ios_base4InitD1Ev(0x6013f4, 0, 224, 0x7f3e45886f50)      = 0x7f3e46769940
+++ exited (status 0) +++

您可以立即看出问题所在:clang++ 从不调用 GOMP_parallel,因此您总是获得一个线程。这是 clang 的疯狂行为。您是否尝试过构建和使用 clang 的 "special" OpenMP version

一些补充意见:

1) 您需要使用-fopenmp=libomp 在clang 中启用OpenMP。 -fopenmp 只是 links libgomp 但忽略所有编译指示。很奇怪,我知道 -- 很快就会在后备箱中更换。

2) 3.7是第一个支持OpenMP的版本。 3.6 没有。

3) clang 只能与 libomp 一起使用。不要将 libgomp(headers 或库)置于 libomp 的道路上! clang 使用 Intel API,不受 libgomp 支持。 -fopenmp=libomp 应该 link 正确的库。

我让它在 Linux Mint 17.2 上运行。 (本质上是 Ubuntu 14.04)与:

软件包:libiomp-dev clang-3.8

编译标志:-fopenmp

链接器标志:-fopenmp=libiomp5

现在编译使用多线程

这里是修改后的FindOpenMP.cmake