第二次无法捕获分段错误

cannot catch segmentation fault second time

发生段错误时,我正在尝试重新启动程序。

我有以下最少的可重现代码:-

#include <csignal>
#include <unistd.h>
#include <iostream>

int app();

void ouch(int sig) {
    std::cout << "got signal " << sig << std::endl;
    exit(app());
}

struct L { int l; };
static int i = 0;

int app() {
    L *l= nullptr;
    while(1) {
        std::cout << ++i << std::endl;
        sleep(1);
        std::cout << l->l << std::endl; //crash
        std::cout << "Ok" << std::endl;
    }
}

int main() {
    struct sigaction act;
    act.sa_handler = ouch;
    sigemptyset(&act.sa_mask);
    act.sa_flags = 0;
    sigaction(SIGKILL, &act, 0);
    sigaction(SIGSEGV, &act, 0);
    return app();
}

它第一次成功捕捉到 sigsegv,但在打印 2 后,它显示分段错误(核心已转储)

1
got signal 11
2
zsh: segmentation fault (core dumped)  ./a.out

在 ArchLinux 上使用 clang 12.0.1 和 gcc 11.1.0 进行测试

这是操作系统特有的行为还是我的代码有问题

问题是,当您通过从 ouch() 内部调用 exit(app()) 重新启动程序时,从技术上讲,您仍然处于信号处理程序内部。信号处理程序被阻止,直到您 return 离开它。由于您从来没有 return,因此您无法捕获第二个 SIGSEGV。

如果您收到 SIGSEGV,则说明发生了非常糟糕的事情,并且不能保证您可以通过再次调用 app() 来“重新启动”该过程。 处理此问题的最佳解决方案是让另一个程序启动您的程序,并在它崩溃时重新启动它。有关如何处理此问题的一些建议,请参阅 this ServerFault question