平台: Linux 适用于: comsol多物理学®,comsol Server™ 版本: 6.0,5.6

问题描述

linux linux上的分布式集群作业启动启动启动启动启动启动启动

解决方法

comsol无法linux集群集群运行的原因可能是是未未正确检测检测网络接口和和光纤光纤光纤。。。。。。在在在在在在在在在在在在在在在在在在在在光纤光纤光纤光纤光纤光纤光纤光纤光纤光纤中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中中

Intel mpi无法无法在上时时运行时时时运行运行运行您的提交脚本脚本配置配置正确正确正确

comsol hydra mpitest -nn 2 -f hostfile

或者,slurm slurm等作业系统,可以

#sbatch -nodes = 2 #sbatch -ntasks -per -node = 1 ... comsol hydra mpitest -nn 2 -nnhost 1

mpi是否是否是问题所在。您开关开关开关'-mpidebug 10'来获取。。。。。。。。

为了这个,您可以以下以下和

A.回退tcp通讯协议

fi_provider,并并其为'sockets'slurm中,可以在命令命令命令

#sbatch  -  export = fi_provider =插座

或者,您可以在在系统系统系统使用使用

导出fi_provider =插座

setEnv fi_provider插座

并确保此变量移交给集群。。

tcp通讯通讯通讯通讯通讯通讯通信通信,如果您通讯光纤光纤

B.安装更版本的的英特尔MPI

您可以从这里下载英特尔MPI 2021.6,然后然后没有的权限权限权限权限权限权限权限权限

然后,使用附加开关启动

-MpiRoot <英特尔2021.6安装目录> /intel/oneapi/mpi/2021.6.0

在slurm上,您您调用命令命令

#sbatch -nodes = 2 #sbatch -ntasks -per -node = 1 ... comsol hydra mpitest -nn 2 -nnhost 1 -mpiroot  /intel/oneapi/oneapi/mpi/mpi/2021.6.021.6.0

备注:

  • MPICH2 MPI安装安装安装安装安装(但但不能能能能指向指向
  • 在comsol 5.6中,您您通过-MpiRoot指指指向向向