平台: Windows,Linux 版本: 所有版本

问题描述

如果您打算为运行分布式的Comsol作业设置自己的计算集群,则此知识库概述了一些硬件建议。

解决方案

根据您要解决的问题类型,您将需要考虑不同的集群体系结构。从选择群集硬件的角度来看,Comsol应用程序可以被归类为一组唯一变化的大型参数,或者是非常大的单个唯一模型,或者需要更多的计算资源来求解比什么可在任何一台计算机上使用。

扫荡

当对不同参数(例如几何尺寸或频率)进行扫描时,可以在群集的不同节点上求解每个不同参数的组合。集群中的每个节点必须具有足够的内存来求解每个唯一模型,并且每个节点应具有相似的类型。跟着硬件建议确定什么是合适的。

节点之间的通信通常是瓶颈,因此建议使用Infiniband或等效的高性能网络。节点的数量可以达到您要运行的同时案例总数的大约1/10。例如,如果您经常想扫描1000个不同的参数值,则最多可达100节点群集是合理的。跨更多节点求解通常不会导致更高的速度,因为在节点之间发送模型数据的开销。

有关解决分布式扫描的指导,请参阅文件:焦耳加热微驱动器 - 分布式参数版本

大型模型

为了求解分布在许多节点上的单个大型模型,群集体系结构变得越来越重要。节点之间的交流更像是瓶颈。强烈建议使用Infiniband或等效的高性能网络。

首先,请确保您知道您预计要解决最大型号需要多少内存。有关预测内存要求的指导,请参见:解决大型COMSOL模型需要多少内存?

一旦知道需要多少内存,就可以确定群集中的节点数量。在解决更多节点上的问题时,您会注意到加速,但是超过一定数量的加速会变得微不足道,甚至可能下降。当这种情况发生时,取决于模型大小。使用指南知识库866用于选择处理器和内存。

解决方案时间将是集群中节点数量的函数,以及comsol多物理学中使用的求解器类型。

一般注意事项

  • Linux或Windows HPCS2008R2操作系统之间的选择不会显着影响性能。

  • Comsol使用MPI(消息传递接口)模型在计算簇上分发计算。

  • 云计算可以通过我们的合作伙伴之一来实现。看在云中运行ComsolMultiphysics®和Comsol Server™有关更多详细信息。