平台: 所有平台 版本: 所有版本

问题描述

我将购买一台新的专用计算机来运行ComsolMultiphysics®。您推荐什么硬件?

解决方案

由于ComsolMultiphysics®求解的各种不同问题类型,软件和硬件开发的快速速度以及以明显不同的价格的不同硬件的速度,因此对于所有使用情况,都没有单一的最佳计算机选择。

记忆

最重要的因素是您有足够的物理内存(RAM)来求解要使用的最大型号,并且正确安装了RAM。如果您没有足够的RAM,那么无论其他所有硬件选择如何,都会大大放缓。

通过求解类似但较小的模型来预测RAM需求,这些模型包含与您要在最大型号中要解决的相同物理的模型。监视所用的内存和自由度,这些自由度在求解器日志中报告。将曲线适合A X(DOF)^n形式的数据,其中A和N是拟合系数,DOF是自由度的数量,并使用它来预测较大模型的内存需求。指数n通常在1到2之间。当使用迭代求解器进行多移民预处理时,n将接近1,当使用直接求解器时,它将更接近2。问题。例如,对于在非局限性耦合的热辐射问题中,A将远高于导电传热问题,而自由度之间只有局部耦合。

请注意,不同模型类型之间的内存使用率与自由度可能会大不相同,因此您可能需要为要解决的每种模型重复此过程。您将需要一台至少具有此RAM的计算机。还要注意,拥有比实际需要更多的RAM没有优势。确保使用您选择的CPU支持的最快内存速度。

性能也很大程度上取决于如何安装内存。所有计算机都通过多通道内存总线访问已安装的内存。如果存储器库未正确填充,则将记忆速度下降。例如,考虑一个带有四个内存库(每个存储器频道)的四个内存通道单CPU计算机,并且这些银行中的每一个都有四个开放式插槽,总共有16个开放的DIMM插槽,如下所示。

电脑的示意图

通常,如果在任何银行中使用了两个以上的插槽,则记忆速度会降低,但是在某些系统上,如果每个银行使用一个以上的插槽,则会放缓。您的硬件供应商应提供此信息。因此,例如,如果要在上述系统中安装16GB RAM,请安装四个4GB或八个2GB DIMM,并确保使用所有内存库。安装四个4GB DIMM为安装更多RAM的空间提供了最大的空间,并最大程度地利用了多个内存通道。不要以某种方式安装DIMM,以使某些内存通道未使用;由于某些内存通道未使用,这将导致大幅放缓。您将需要添加更多RAM来利用所有内存频道。这在下面的原理图中总结了。

推荐的内存布局

影响整体软件速度的其他因素

性能,CPU类型,CPU基本频率,缓存,CPU数量,每个CPU的内核数和硬件成本之间存在复杂的关系。COMSOL代码库由几个不同类别的算法组成,这些算法具有不同的缩放属性。因此,某些硬件因素比其他因素的性能更大,而这些因素的相对优点既是问题类型,又取决于问题大小。因此,很难提出特定的硬件建议。以下是一般建议。

CPU类型

不同的CPU体系结构以明显不同的价格提供了不同的功能集。

高端CPU,例如Intel®Xeon®Gold和Platinum或AMD®EPYC®,处理器具有CPU至CPU互连,可允许每台计算机多个CPU,并允许CPU相互通信以访问非常大的大型CPU记忆量。这些处理器具有最高的内存带宽;在RAM内存和处理器之间快速移动大量数据的能力。这是他们运行comsol时的主要优势。高端CPU应用于双CPU,甚至四个CPU或八个CPU的配置。如果您需要解决大量的内存,或者计划并行进行许多模拟,这是有动力的。在解决单个模型时,性能会随着CPU数量的增加而提高,但相对性能的改进取决于模型大小。较大的模型将在多CPU系统上看到更大的加速。如果您正在考虑购买四个或八个CPU系统,请联系COMSOL技术支持。

中端CPU,例如Intel®Xeon®W或AMD®Ryzen™ThreadRripper™,处理器,没有CPU-to-CPU互连,因此是单CPU计算机的合适选择。它们确实具有可比的时钟速度和核心数量作为高端系统。它们是一个有吸引力的全能选择。

入门级CPU,例如Intel®Xeon®E处理器,具有两个内存频道,没有CPU到CPU互连,并且无法解决那么多的内存。它们具有最低的内存带宽,但可以具有高时钟速度。它们并不是并行运行多个模拟的理想选择,但通常可以很快解决单个模型。

上面列出的CPU是针对专业工程社区推销的当前生成处理器。也有一些处理器主要针对消费市场,它们具有许多相同的功能,并且通常以较低的成本而具有可比性的性能。

时钟频率

较高的时钟频率通常会导致所有区域中软件的性能更快。如果所有其他硬件规格都是相同的,则两台计算机之间的相对性能将最直接取决于时钟频率。

高速缓存存储器

缓存内存直接构建到处理器中。较高的缓存更好。所有其他因素相等,更高的缓存机将显示出更好的性能。

核心数

处理器中的核心越多,可以立即执行的平行线程越多,这被称为多线程。comsol将自动利用所有可用的内核,但要有计算成本。并行使用太多的核心甚至可能导致放缓,尽管通常仅适用于相对较小的型号。一些模型甚至由其单线程性能主导。通常,六或八核系统是一个不错的全方位选择,但是核心比这更好,尤其是在并行运行多个模型时,或者使用Pardiso Direct Direct Solver时。


一般建议

参数扫描

如果您打算解决许多几何变化,不同的网格,不同的材料集或每个唯一模型中的其他参数,那么您将使用参数扫描功能。例如,扫描零件维的10个变化以及扫描10种不同的材料和10个不同模型参数的扫描将需要求解相似的型号1000倍,而在单个计算机上运行此作业时的解决方案时间将(在最坏的情况下)大约要大约1000倍。

可以通过在一台计算机上,使用任何许可证类型或在集群计算机上,使用该扫描来扫描大量参数的解决方案时间。浮网络许可证

要在一台计算机上并行求解,请使用批处理功能。仅当所有模型同时适合内存时,才建议在一台计算机上并行运行参数扫描。例如,如果模型的一个实例需要3GB的RAM求解,那么在16GB RAM计算机上运行四个同时工作是有意义的。对于记忆需求较小的型号,您可能会看到有核心与有核心一样多的同时工作的改进。使用批处理时的相对加速既取决于模型和硬件。

要在集群上并行解决参数扫描,请使用簇扫功能。您可以立即运行的并行作业数量没有限制(群集上可用节点的数量。)您可以在自己的群集上运行或使用第三方集群。comsol保留了一个清单技术合作伙伴谁为集群计算提供按需计算资源。群集的每个节点只需满足运行唯一模型所描述的要求即可。有关集群硬件的进一步指导,请参阅知识库1116。

也可以看看知识基础1250:从命令行中运行参数扫描,批处理扫描和集群。

始终考虑是否可以通过使用优化模块。

操作系统

在版本5.4之前的Comsol多物理版本中,Linux和MacOS操作系统可以在某些带有许多内核的处理器上胜过某些处理器的窗口。

硬盘驱动器

与硬盘驱动器相比,固态驱动器可以使整体的系统性能更好。更快的驱动器总是更好,但是如果系统在您要解决的模型上使用驱动器进行交换空间(虚拟内存),则最好升级RAM,而不是投资更快的驱动器。

图形

我们建议基于现代AMD或NVIDIA的专用图形卡。可以在系统要求页面。图形卡中的内存越大,可以看到越复杂的模型。请注意,仅仅因为模型需要大量的RAM内存来求解,并不一定意味着它需要显示大型视频卡,反之亦然。

GPU

当前不支持图形处理单元上的通用计算。

也可以看看

选择用于计算集群的硬件,解决方案1116
comsol和多线程,解决方案1096