平台: 所有平台 版本: 所有版本

问题描述

我将购买一台新的专用计算机来运行ComsolMultiphysics®。您推荐什么硬件?

解决方案

由于ComsolMultiphysics®求解的各种不同问题类型,软件和硬件开发的快速速度以及以明显不同的价格的不同硬件的速度,因此对于所有使用情况,都没有单一的最佳计算机选择。

记忆

最重要的因素是您有足够的物理内存(RAM)来求解要使用的最大型号,并且正确安装了RAM。如果您没有足够的RAM,那么无论其他所有硬件选择如何,都会大大放缓。

通过求解类似但较小的模型来预测RAM需求,这些模型包含与您要在最大型号中要解决的相同物理的模型。监视所用的内存和自由度,这些自由度在求解器日志中报告。将曲线适合A X(DOF)^n形式的数据,其中A和N是拟合系数,DOF是自由度的数量,并使用它来预测较大模型的内存需求。指数n通常在1到2之间,最大程度地取决于线性系统求解器正在使用。因子A最大程度地取决于物理的类型和物理的组合,但也可以取决于模型中的特定特征。请注意,不同模型类型之间的内存使用率与自由度可能会大不相同,因此您可能需要为要解决的每种模型重复此过程。

您将需要一台具有至少估计最大RAM的计算机。还要注意,拥有比实际需要更多的RAM没有优势。确保使用您选择的CPU支持的最快内存速度。

性能也很大程度上取决于如何安装内存。计算机通过多通道内存总线访问已安装的内存。如果存储器未正确填充,则将记忆速度下降。例如,考虑一个四个内存通道单CPU计算机,每个通道有两个插槽,总共8个开放DIMM插槽,如下所示。假设您希望安装64 GB的RAM,则可以通过几种方法进行操作。

电脑的示意图

对于这台计算机,就计算机性能而言,最佳方法是用一个8 GB DIMM填充所有八个插槽。但是,这有一个缺点是不可能扩展,如果您需要升级RAM,则需要购买所有新内存。几乎最佳的方法是将每个内存通道16 GB DIMM放置。性能可能略低于最佳配置,但可以通过购买四个16GB DIMM来加倍安装的内存,因此这种配置是最好的总体。纯粹在可扩展性方面,最好的选择是安装单个64 GB DIMM,因为这会留下最空的插槽。但是,在这种情况下的性能可能会慢四倍,尤其是对于大型内存模型。仅当扩展性是主要问题时,才建议使用此配置。其他配置没有优势。这在下面的原理图中总结了。与您的硬件供应商有关最佳内存安装的检查也很好。

推荐的内存布局

影响整体软件速度的其他因素

性能,CPU类型,CPU基本频率,缓存,CPU数量,每个CPU的内核数和硬件成本之间存在复杂的关系。COMSOL代码库由几个不同类别的算法组成,这些算法具有不同的缩放属性。因此,某些硬件因素比其他因素的性能更大,而这些因素的相对优点既是问题类型,又取决于问题大小。因此,很难提出特定的硬件建议。以下是一般建议。

CPU类型

不同的CPU体系结构以明显不同的价格提供了不同的功能集。

高端CPU,例如Intel®Xeon®Gold和Platinum或AMD®EPYC®,处理器具有CPU至CPU互连,可允许每台计算机多个CPU,并允许CPU相互通信以访问非常大的大型CPU记忆量。这些处理器具有最高的内存带宽;在RAM内存和处理器之间快速移动大量数据的能力。这是他们运行comsol时的主要优势。高端CPU应用于双CPU,甚至四个CPU或八个CPU的配置。如果您需要解决大量的内存,或者计划并行进行许多模拟,这是有动力的。在解决单个模型时,性能会随着CPU数量的增加而提高,但相对性能的改进取决于模型大小。较大的模型将在多CPU系统上看到更大的加速。如果您正在考虑购买四个或八个CPU系统,请联系COMSOL技术支持。

中端CPU,例如Intel®Xeon®W或AMD®Ryzen™ThreadRripper™,处理器,没有CPU-to-CPU互连,因此是单CPU计算机的合适选择。它们确实具有可比的时钟速度和核心数量作为高端系统。它们是一个有吸引力的全能选择。

消费级CPU,例如Intel®Core™处理器,可以具有非常好的甚至更好的性能,尤其是在求解较小的记忆模型时。

时钟频率

较高的时钟频率通常会导致所有区域中软件的性能更快。如果所有其他硬件规格都是相同的,则两台计算机之间的相对性能将最直接取决于时钟频率。

高速缓存存储器

缓存内存直接构建到处理器中。较高的缓存更好。所有其他因素相等,更高的缓存机将显示出更好的性能。

核心数

处理器中的核心越多,可以立即执行的平行线程越多,这被称为多线程。comsol将自动利用所有可用的内核,但要有计算成本。并行使用太多的核心甚至可能导致放缓,尽管通常仅适用于相对较小的型号。一些模型甚至由其单线程性能主导。通常,六或八核系统是一个不错的全方位选择,但是核心比这更好,尤其是在并行运行多个模型时,或者使用Pardiso Direct Direct Solver时。


一般建议

参数扫描

如果您打算解决许多几何变化,不同的网格,不同的材料集或每个唯一模型中的其他参数,那么您将使用参数扫描功能。例如,扫描零件维的10个变化以及扫描10种不同的材料和10个不同模型参数的扫描将需要求解相似的型号1000倍,而在单个计算机上运行此作业时的解决方案时间将(在最坏的情况下)大约要大约1000倍。

可以通过在一台计算机上,使用任何许可证类型或在集群计算机上,使用该扫描来扫描大量参数的解决方案时间。浮网络许可证

要在一台计算机上并行求解,请使用批处理功能。仅当所有模型同时适合内存时,才建议在一台计算机上并行运行参数扫描。例如,如果模型的一个实例需要3GB的RAM求解,那么在16GB RAM计算机上运行四个同时工作是有意义的。对于具有较小内存需求的型号,您可能会看到有核心与有核心一样多的同时工作的改进。使用批处理时的相对加速既取决于模型和硬件。

要在集群上并行解决参数扫描,请使用簇扫功能。您可以立即运行的并行作业数量没有限制(群集上可用节点的数量。)您可以在自己的群集上运行或使用第三方集群。comsol保留了一个清单技术合作伙伴谁为集群计算提供按需计算资源。群集的每个节点只需满足运行唯一模型所描述的要求即可。有关集群硬件的进一步指导,请参阅知识库1116。

也可以看看知识基础1250:从命令行中运行参数扫描,批处理扫描和集群。

始终考虑是否可以通过使用优化模块。

操作系统

在版本5.4之前的Comsol多物理版本中,Linux和MacOS操作系统可以在某些带有许多内核的处理器上胜过某些处理器的窗口。

硬盘驱动器

与硬盘驱动器相比,固态驱动器可以使整体的系统性能更好。更快的驱动器总是更好,但是如果系统在您要解决的模型上使用驱动器进行交换空间(虚拟内存),则最好升级RAM,而不是投资更快的驱动器。

图形

我们建议基于现代AMD或NVIDIA的专用图形卡。可以在系统要求页面。图形卡中的内存越大,可以看到越复杂的模型。请注意,仅仅因为模型需要大量的RAM内存来求解,并不一定意味着它需要显示大型视频卡,反之亦然。

GPU

当前不支持图形处理单元上的通用计算。

也可以看看

选择用于计算集群的硬件,解决方案1116
comsol和多线程,解决方案1096