MPI 发送和接收死锁
MPI send and receive deadlock
我是 MPI 的新手,我只是在编写一个基本的发送和接收模块,我在其中将 12 个月发送给 n 个处理器并接收每个月并打印其值。所以我能够正确发送值,也能够接收所有值,但我的程序卡住了,即它最后没有打印 "After program is complete"。你能帮忙吗
#include <stdio.h>
#include <string.h>
#include "mpi.h"
#include<math.h>
int main(int argc, char* argv[]){
int my_rank; /* rank of process */
int p; /* number of processes */
int tag=0; /* tag for messages */
MPI_Status status ; /* return status for receive */
int i;
int pro;
/* start up MPI */
MPI_Init(&argc, &argv);
// find out process rank
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
//find out number of processes
MPI_Comm_size(MPI_COMM_WORLD, &p);
if (my_rank==0)
{
for(i=1;i<=12;i++)
{
pro = (i-1)%p;
MPI_Send(&i, 1, MPI_INT,pro, tag, MPI_COMM_WORLD);
printf("Value of Processor is %d Month %d\n",pro,i);
}
}
//else{
for(int n=0;n<=p;n++)
{
MPI_Recv(&i, 1, MPI_INT, 0, tag, MPI_COMM_WORLD, &status);
printf("My Month is %d and rank is %d\n",i,my_rank);
}
//}
MPI_Barrier(MPI_COMM_WORLD);
if(my_rank==0)
{
printf("After program is complete\n");
}
/* shut down MPI */
MPI_Finalize();
return 0;
}
Below is the output:
Value of Processor is 0 Month 1
Value of Processor is 1 Month 2
Value of Processor is 2 Month 3
Value of Processor is 3 Month 4
Value of Processor is 4 Month 5
Value of Processor is 0 Month 6
Value of Processor is 1 Month 7
Value of Processor is 2 Month 8
Value of Processor is 3 Month 9
Value of Processor is 4 Month 10
Value of Processor is 0 Month 11
My Month is 2 and rank is 1
My Month is 7 and rank is 1
My Month is 3 and rank is 2
My Month is 8 and rank is 2
Value of Processor is 1 Month 12
My Month is 1 and rank is 0
My Month is 6 and rank is 0
My Month is 11 and rank is 0
My Month is 12 and rank is 1
My Month is 4 and rank is 3
My Month is 9 and rank is 3
My Month is 5 and rank is 4
My Month is 10 and rank is 4
第一:你违反了MPI的基本规则之一,你必须匹配一个发送和一个接收。
在您的示例 运行 中,您 运行 有 5 个处理器(等级),如您所见,等级 0 向等级 0 发送 3 条消息,向其余等级发送 1 和 2 条消息。但是,每个级别的职位有13个接收。所以他们自然会陷入等待从未发送的消息。请记住,MPI_Recv
循环中的代码由所有级别执行。所以一共会收到5 * 13次。
如果轮到你接收,你可以通过在循环内过滤来解决这个问题。但这取决于你是否事先知道等级 0 将发送多少消息——你可能需要更复杂的机制。
其次: 你排名 0 向自己发送一个阻塞消息(没有先发布一个非阻塞接收)。这已经可能导致僵局。请记住,在发布匹配接收之前,MPI_Send
永远不会保证 return,即使在实践中有时可能如此。
第三:即循环for(int n=0;n<=p;n++)
运行s 13次。你肯定不想要那个,即使你 运行 12 次它是不正确的。
最后: 对于具体示例,首选解决方案是将月份保存在数组中并使用 MPI_Scatterv
.[=15 将其分布在所有进程中=]
我是 MPI 的新手,我只是在编写一个基本的发送和接收模块,我在其中将 12 个月发送给 n 个处理器并接收每个月并打印其值。所以我能够正确发送值,也能够接收所有值,但我的程序卡住了,即它最后没有打印 "After program is complete"。你能帮忙吗
#include <stdio.h>
#include <string.h>
#include "mpi.h"
#include<math.h>
int main(int argc, char* argv[]){
int my_rank; /* rank of process */
int p; /* number of processes */
int tag=0; /* tag for messages */
MPI_Status status ; /* return status for receive */
int i;
int pro;
/* start up MPI */
MPI_Init(&argc, &argv);
// find out process rank
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
//find out number of processes
MPI_Comm_size(MPI_COMM_WORLD, &p);
if (my_rank==0)
{
for(i=1;i<=12;i++)
{
pro = (i-1)%p;
MPI_Send(&i, 1, MPI_INT,pro, tag, MPI_COMM_WORLD);
printf("Value of Processor is %d Month %d\n",pro,i);
}
}
//else{
for(int n=0;n<=p;n++)
{
MPI_Recv(&i, 1, MPI_INT, 0, tag, MPI_COMM_WORLD, &status);
printf("My Month is %d and rank is %d\n",i,my_rank);
}
//}
MPI_Barrier(MPI_COMM_WORLD);
if(my_rank==0)
{
printf("After program is complete\n");
}
/* shut down MPI */
MPI_Finalize();
return 0;
}
Below is the output:
Value of Processor is 0 Month 1
Value of Processor is 1 Month 2
Value of Processor is 2 Month 3
Value of Processor is 3 Month 4
Value of Processor is 4 Month 5
Value of Processor is 0 Month 6
Value of Processor is 1 Month 7
Value of Processor is 2 Month 8
Value of Processor is 3 Month 9
Value of Processor is 4 Month 10
Value of Processor is 0 Month 11
My Month is 2 and rank is 1
My Month is 7 and rank is 1
My Month is 3 and rank is 2
My Month is 8 and rank is 2
Value of Processor is 1 Month 12
My Month is 1 and rank is 0
My Month is 6 and rank is 0
My Month is 11 and rank is 0
My Month is 12 and rank is 1
My Month is 4 and rank is 3
My Month is 9 and rank is 3
My Month is 5 and rank is 4
My Month is 10 and rank is 4
第一:你违反了MPI的基本规则之一,你必须匹配一个发送和一个接收。
在您的示例 运行 中,您 运行 有 5 个处理器(等级),如您所见,等级 0 向等级 0 发送 3 条消息,向其余等级发送 1 和 2 条消息。但是,每个级别的职位有13个接收。所以他们自然会陷入等待从未发送的消息。请记住,MPI_Recv
循环中的代码由所有级别执行。所以一共会收到5 * 13次。
如果轮到你接收,你可以通过在循环内过滤来解决这个问题。但这取决于你是否事先知道等级 0 将发送多少消息——你可能需要更复杂的机制。
其次: 你排名 0 向自己发送一个阻塞消息(没有先发布一个非阻塞接收)。这已经可能导致僵局。请记住,在发布匹配接收之前,MPI_Send
永远不会保证 return,即使在实践中有时可能如此。
第三:即循环for(int n=0;n<=p;n++)
运行s 13次。你肯定不想要那个,即使你 运行 12 次它是不正确的。
最后: 对于具体示例,首选解决方案是将月份保存在数组中并使用 MPI_Scatterv
.[=15 将其分布在所有进程中=]