平台:
Linux
适用于:
comsol多物理学®,comsol Server™
版本:
6.0,5.6
问题描述
linux linux上的分布式集群作业启动启动启动启动启动启动启动
解决方法
comsol无法linux集群集群运行的原因可能是是未未正确检测检测网络接口和和光纤光纤光纤。。。。。。在在在在在在在在在在在在在在在在在在在在光纤光纤光纤光纤光纤光纤光纤光纤光纤光纤中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中
Intel mpi无法无法在上时时运行时时时运行运行运行您的提交脚本脚本配置配置正确正确正确
comsol hydra mpitest -nn 2 -f hostfile
或者,slurm slurm等作业系统,可以
#sbatch -nodes = 2 #sbatch -ntasks -per -node = 1 ... comsol hydra mpitest -nn 2 -nnhost 1
mpi是否是否是问题所在。您开关开关开关'-mpidebug 10'来获取。。。。。。。。
为了这个,您可以以下以下和
A.回退tcp通讯协议
fi_provider,并并其为'sockets'slurm中,可以在命令命令命令
#sbatch - export = fi_provider =插座
或者,您可以在在系统系统系统使用使用
导出fi_provider =插座
或
setEnv fi_provider插座
并确保此变量移交给集群。。
tcp通讯通讯通讯通讯通讯通讯通信通信,如果您通讯光纤光纤
B.安装更版本的的英特尔MPI
您可以从这里下载英特尔MPI 2021.6,然后然后没有的权限权限权限权限权限权限权限权限
然后,使用附加开关启动
-MpiRoot <英特尔2021.6安装目录> /intel/oneapi/mpi/2021.6.0
在slurm上,您您调用命令命令
#sbatch -nodes = 2 #sbatch -ntasks -per -node = 1 ... comsol hydra mpitest -nn 2 -nnhost 1 -mpiroot /intel/oneapi/oneapi/mpi/mpi/2021.6.021.6.0
备注:
- MPICH2 MPI安装安装安装安装安装(但但不能能能能指向指向
- 在comsol 5.6中,您您通过-MpiRoot指指指向向向
comsol尽一切努力验证在此页面查看查看信息。本页面页面提供提供提供的的资源资源资源资源和供供供参考,comsol comsol对对对对对对对其有效性有效性有效性不不不任何法律本中引用的任何为其所有者的的财产。。有关完整完整的的商标商标商标商标详细信息信息信息