MPI 发送和接收死锁

MPI send and receive deadlock

我是 MPI 的新手,我只是在编写一个基本的发送和接收模块,我在其中将 12 个月发送给 n 个处理器并接收每个月并打印其值。所以我能够正确发送值,也能够接收所有值,但我的程序卡住了,即它最后没有打印 "After program is complete"。你能帮忙吗

#include <stdio.h>
#include <string.h>
#include "mpi.h"
#include<math.h>

int main(int argc, char* argv[]){
int  my_rank; /* rank of process */
int  p;       /* number of processes */

int tag=0;    /* tag for messages */

MPI_Status status ;   /* return status for receive */
int i;
int pro;
/* start up MPI */

MPI_Init(&argc, &argv);

// find out process rank
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank); 

//find out number of processes
MPI_Comm_size(MPI_COMM_WORLD, &p); 
if (my_rank==0)
{
    for(i=1;i<=12;i++)
    {
        pro = (i-1)%p;
        MPI_Send(&i, 1, MPI_INT,pro, tag, MPI_COMM_WORLD);
        printf("Value of Processor is %d Month %d\n",pro,i);
    }
}

//else{
for(int n=0;n<=p;n++)
{

    MPI_Recv(&i, 1, MPI_INT, 0, tag, MPI_COMM_WORLD, &status);
    printf("My Month is %d and rank is %d\n",i,my_rank);

}
//}
MPI_Barrier(MPI_COMM_WORLD);
if(my_rank==0)
{
    printf("After program is complete\n");
}
/* shut down MPI */

MPI_Finalize(); 
return 0;
}

Below is the output:
Value of Processor is 0 Month 1
Value of Processor is 1 Month 2
Value of Processor is 2 Month 3
Value of Processor is 3 Month 4
Value of Processor is 4 Month 5
Value of Processor is 0 Month 6
Value of Processor is 1 Month 7
Value of Processor is 2 Month 8
Value of Processor is 3 Month 9
Value of Processor is 4 Month 10
Value of Processor is 0 Month 11
My Month is 2 and rank is 1
My Month is 7 and rank is 1
My Month is 3 and rank is 2
My Month is 8 and rank is 2
Value of Processor is 1 Month 12
My Month is 1 and rank is 0
My Month is 6 and rank is 0
My Month is 11 and rank is 0
My Month is 12 and rank is 1
My Month is 4 and rank is 3
My Month is 9 and rank is 3
My Month is 5 and rank is 4
My Month is 10 and rank is 4

第一:你违反了MPI的基本规则之一,你必须匹配一个发送和一个接收。

在您的示例 运行 中,您 运行 有 5 个处理器(等级),如您所见,等级 0 向等级 0 发送 3 条消息,向其余等级发送 1 和 2 条消息。但是,每个级别的职位有13个接收。所以他们自然会陷入等待从未发送的消息。请记住,MPI_Recv 循环中的代码由所有级别执行。所以一共会收到5 * 13次。

如果轮到接收,你可以通过在循环内过滤来解决这个问题。但这取决于你是否事先知道等级 0 将发送多少消息——你可能需要更复杂的机制。

其次: 你排名 0 向自己发送一个阻塞消息(没有先发布一个非阻塞接收)。这已经可能导致僵局。请记住,在发布匹配接收之前,MPI_Send 永远不会保证 return,即使在实践中有时可能如此。

第三:即循环for(int n=0;n<=p;n++)运行s 13次。你肯定不想要那个,即使你 运行 12 次它是不正确的。

最后: 对于具体示例,首选解决方案是将月份保存在数组中并使用 MPI_Scatterv.[=15 将其分布在所有进程中=]