Perl - 多线程脚本打印内存映射和回溯

Perl - Multithreading script prints memory map and backtrace

当我调用我的多线程 perl 脚本时,在某些情况下,它会抛出一些类似于以下内容的异常。很抱歉我无法共享代码。但如果真的需要,我可以尝试构建一个片段(如果真的需要的话)。因为我想这应该有一些理论上的答案。

*** glibc detected *** perl: double free or corruption (!prev): 0x00007f775401e9a0 ***
======= Backtrace: =========
/lib64/libc.so.6[0x3d74c75e66]
/lib64/libc.so.6[0x3d74c789b3]
/lib64/libc.so.6[0x3d74c7b880]
/lib64/libc.so.6(realloc+0xe5)[0x3d74c7baf5]
/usr/lib/../lib64/libcrypto.so.10(CRYPTO_realloc+0x5f)[0x7f775907bd8f]
/usr/lib/../lib64/libcrypto.so.10(lh_insert+0xee)[0x7f77590f763e]
/usr/lib/../lib64/libcrypto.so.10(OBJ_NAME_add+0x6b)[0x7f775907f12b]
/usr/lib/../lib64/libcrypto.so.10(EVP_add_cipher+0x27)[0x7f7759102387]
/usr/lib/../lib64/libcrypto.so.10(OpenSSL_add_all_ciphers+0x4b7)[0x7f7759106a07]
/usr/lib/../lib64/libcrypto.so.10(OPENSSL_add_all_algorithms_noconf+0xe)[0x7f775910653e]
/usr/local/lib/libssh2.so.1(libssh2_init+0x39)[0x7f77596800b9]

为什么我会收到这样的错误?

我正在使用Thread::Queue;使用 threads::shared;请让我知道你的看法。

以下是线程库版本信息。

use threads; - installed v2.15 (latest - 2.16)
use Thread::Queue; - installed v3.12 (up to date)
use threads::shared; - installed v1.56 (latest - 1.57)
perl - installed v5.26.1

其他图书馆有::

use YAML::XS 'LoadFile';  - 0.66 up to date
use Net::Netconf::Manager; - 1.02 up to date
use Config::Properties; - 1.80 up to date
use Sys::Syslog; - 0.35 up to date
use DateTime::Format::Strptime; - 1.74 up to date
use DateTime; - 1.44 up to date
use XML::LibXML; - 2.0129 (latest 2.0139)
use Regexp::Common qw/net/; - 2017060201 up to date
use Getopt::Long; - 2.5 up to date

为了给您一个肯定的答案,我们需要一些我们可以 运行 并进行故障排除的东西。否则错误不可重现。

话虽如此 - 这看起来类似于我之前遇到的某些模块不是线程安全的情况 - 它们通常 运行 很好,然后偶尔会在你的脸上爆炸。

例如Crypt::SSLeay back in 2008. Net::SSLeay 1.4.2 之前

一般的解决方法是停止在编译时使用use加载罪魁祸首——因为这样所有线程都会继承相同的状态——而不是线程中,在运行时间使用requireimport加载它们。通过这样做,您隔离了它们 - 您的线程将花费 稍微 更长的时间来启动,但无论如何您都不应该在 perl 中向线程发送垃圾邮件。

或者使用线程安全的不同模块。

随着您的更新和屏幕截图 - Net::SSH2 被提及 - 这意味着您的其他模块之一正在引入它。

但是 Net::SSH thread safey indicates that libssh 可能对线程安全有一些限制:

Thread-safe: just don't share handles simultaneously

你没有明确提到使用它,但它看起来像是被另一个模块引入了。猜测是 Net::Netconf::Manager

作为第二个进一步的猜测 - 它很可能正在执行 'share handles' 因为它没有意识到它正在线程中 运行。

所以这个模块是我建议在线程中隔离的模块:

require 'Net::NetConf::Manager';
Net::NetConf::Manager -> import; 

并在线程内进行实例化。

由于您使用的是工作线程模型,这应该是最小的开销,并且意味着您不会遇到这个问题。

但更一般地说,假定模块是线程安全的是不明智的,除非它们明确声明它们是。主要的 'tripping' 点通常是模块可以 assumed/implied 共享任何类型的资源,例如网络套接字、文件句柄、数据库连接等。通常在实例化时创建套接字(例如点你传递 username/password) 并且有两个线程试图同时驱动一个套接字是一个潜在的竞争条件。