MPI环境配置(二)
在云服务器上搭建MPI分布式集群环境,采用NFS统一数据,这一次配置时遇到了几个问题,记录一下
详细MPI集群环境配置
NFS环境搭建,注意,NFS不需要ssh免密登录,不相关
本次遇到的问题
1、免密登录,需要能免密登录本机
有两台机器,node1和node2
那么不仅需要node1能够免密登录node2 和 node2能够免密登录node1,还需要node1能够免密登录node1 和 node2能够免密登录node2
2、这一次使用的用户名都是wj,但是依然出现了错误:
Host key verification failed
一直以为是hosts
文件配置出错或者是ssh
免密登录没有配置好,最后发现是在执行程序时,使用的命令有问题
错误命令:
sudo mpiexec -n 4 -f /home/wj/nfs/mpi_config_file ./cpi
正确命令:
mpiexec -n 4 -f /home/wj/nfs/mpi_config_file ./cpi
区别就是,使用sudo
后,执行程序的用户变为root
,而在配置免密登录时,配置的是用户wj
的免密登录
正确执行命令为:nfs
服务端配置在wj
机器上,如上,能较快得到运算结果
但是在nfs
客户端机器ecs-sn3-medium-2-linux-20200212212636
上却很久都得不到运算结果,通过将执行程序和mpi_cinfig_file移出nfs对应目录,依旧如此,证明与nfs文件系统无关。在该机器上单机运行正常。
考虑是不同公司的云服务器,可能对特定任务有限制?这种情况属特例,自行搭建的本地集群一般不会有这种问题。
来源:CSDN
作者:jeewang
链接:https://blog.csdn.net/u013095333/article/details/104803836