hpc)硬件性能硬件硬件硬件运行运行运行运行运行运行运行运行软件软件软件软件软件类型的分析都非常非常有利有利有利有利有利都都都都都都都这这这这这这是是创建创建创建集群集群集群计算节点节点主要主要主要设施集成,同时保持用户界面的便利性在篇文章文章中中中中中中中中文章文章文章博客博客博客博客将将将将学习学习学习学习学习如何如何直接直接直接从从从从从
什么是集群?
hpc硬件最的类型是集群;它网络的一组独立独立后者通常((
在comsol参考手册,comsol多物理学进程进程进程。无关紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要紧要在需要需要对者进行进行区分区分时时时时时时时时时时时时时时时时时时时我们我们计算节点或进程。
包含四计算节点的。。
我们要上执行工作被捆绑成单元称为称为称为作业),并提交。这种情况的是是通过通过通过通过通过通过通过通过
向集群时时,集群会执行两::
- 决定哪些运行作业,以及以及运行运行运行
- 限制对访问,使多个之间会干扰干扰干扰
这些任务分别称为调度程序和资源管理程序的程序,由于大多数都两个任务
请注意,在提交集群脚本,可以,可以使用中中comsol批次
命令(linux®(操作)或)或comsolbatch.exe
(windows®)提交comsol Multiphysics作业作业如果熟悉基于的集群集群,你访问,你你可能更喜欢这这种种种方法。有关多信息信息在集群上行运行comsol®”。
在接下来中,我们将探讨使用使用集群计算节点从comsoldesktop®图形界面图形界面和监控作业。。。
从简单开始测试集群计算节点
每当想尚不熟悉的配置配置集群计算节点时时简单简单母线模型。模型需几分钟即可可完成完成求解求解求解求解求解求解求解求解求解求解求解求解求解
为了在上母线模型模型,我们模型模型模型模型集群计算节点添加中。,我们我们启用启用启用启用高级研究选项。为,我们可以激活首选项中的,也可以单击“模型”工具栏中的显示按钮。
激活高级研究选项以启用集群计算节点。
现在,通过右键单击“研究”并选择集群计算,可以将集群计算节点添加任何研究中。
右键单击“研究”,然后,然后从菜单选择选择集群,,将其到模型中。
如果找不到集群计算节点,可能是的未启用如如如集群许可证学术类学术类课堂课堂课堂)许可证选项。
集群计算节点设置
使用集群计算节点最部分找到正确的设置设置首使用它。能够能够在在集群集群集群中中中成功成功成功地节点节点节点节点节点节点节点节点节点节点节点节点节点
为了将为默认选项,你你在在在多核与计算和远程计算栏的首选项下更改此外,你也可以默认直接于于于集群计算节点,然后单击“设置”窗口顶部的保存图标。你这些存储选项选项,这样
讨论集群计算节点的设置在本篇范围范围内,因此因此内内将重点重点讨论一comsol多物理参考手册获取更信息在本博客文章中
- comsolMultiphysics®在Windows®机器机器运行,我们要将提交集群集群集群
- linux®系统上运行运行,slurm®软件软件调度程序
这些设置屏幕截图::
首先,我们我们看看集群计算设置slurm®软件软件作为程序程序,因此将将将调度调度程序类型设为“ slurm”。。选项特定于slurm®类型类型程序:
- 调度程序留空,指示slurm®软件软件当前可的程序程序
- 用户是的名,可以可以以登录所用的名名名
- 队列名称是要其提交作业名称名称
本例使用的机器上有两个队列:“cluster”用于多达 10 个物理计算节点的作业,每个节点的 RAM 为 64 GB;“fatnode”用于 256 GB 的单个节点。每个集群都有不同,你你集群管理员使用队列。。
下个为为为目录目录目录目录目录目录目录目录目录目录,comsol多物理学文件
接下来的编辑用于指定集群的位置。请注意,目录Windows®Windows®路径这里我们我们使用的的的是是计算机计算机计算机计算机计算机)匹配。
服务器目录指定-服务器-服务器下下,comsol多物理学会话会话会话时时时时时时时时时时时时时时时时计算计算集群集群集群集群集群集群集群集群集群集群集群集群应应应存储的的位置。。从从本地本地机器集群集群时外部comsol批批目录目录,,这这中上模型,状态文件和的位置。。对于这些路径路径路径路径路径路径路径路径请请请确保选择选择一一个已经存在并且并且您您有有写入的的参阅上一篇有关-使用-服务器-服务器模式模式的文章文章,获取更信息信息)。)。
comsol安装目录一,应该,应该包含文件夹箱
,申请
等文件,默认,通常,通常类似于,“/usr/local/comsol/comsol/v53a/supperysics/”,但但明显取决于取决于取决于取决于取决于取决于取决于取决于取决于取决于在在
远程连接设置。
下一重要的栏是远程和云访问,这是如何本地计算机远程之间建立的。。。
Windows®工作站工作站连接到到到集群集群,我们集群集群集群第三油灰comsol®Sshssh客户客户。确保确保确保确保已已已可以它与集群集群连接连接。。此外此外此外此外此外此外此外还还还要要确保确保使用使用一一个个公私密钥对对来来来设置设置无于集群完成此后后,putty的的的SSH目录,并在SSH密钥文件无密码验证产生的文件将将将SSH用户设为你集群上的。。
ssh用于登录命令命令,scp用用(((例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件文件例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如例如)
最后,在远程主机下输入地址,它它是是或或地址。还请将将将远程操作系统设为上的正确。。
完成上述后,你单击单击“设置”窗口窗口的的保存图标,下次远程作业时,可以作业时这些。。。。
测试集群是否的另一种种可行使用使用使用使用使用使用使用使用使用使用使用使用使用使用使用使用集群设置验证应用程序。
在集群上研究
每次时的设置包括模型模型和要使用的物理节点数量数量。。。。当当当你你你你你你你你单击后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后后到集群步是向调度程序作业仿真仿真此阶段阶段后,外部进程窗口会出现,并通知集群上仿进度在这个阶段阶段,comsoldesktop®被被,软件,软件软件忙于忙于忙于
在外部进程窗口中作业进度进度进度,(((从顶))一直一直完成完成)。
这个过程与批处理扫描节点的非常。事实上事实上,你可以事实上通过通过使用批处理扫描功能来识别外部进程窗口。像批扫描,我们一样,我们可以单击单击外部进程窗口下方的脱离作业按钮,gui从远程分离出来出来,从而从而出来进行控制。附加作业按钮重新同个,当作业作业作业作业时了了脱离作业按钮。
通常,在两机器同时运行运行运行运行运行运行运行运行需要需要需要许可证许可证使用批处理许可证选项,以便远程出来出来即是,它们说说它们只全局不一样的限制限制是是你的的本地用户用户名名需要需要与远程远程集群上的证,否则,即使,即使了使用批处理许可证选项,也也用额外许可证。。
仿真后后
集群作业,系统系统你立即已的文件文件。
如果你选择否,稍后仍然文件,因为因为下载并到设置中指定的目录。我们我们来看看
集群作业在本地端文件文件。
comsol多物理学定期定期定期定期定期定期从远程远程集群集群集群中检索中检索进度窗口中状态,并在结束后通知。远程端也存在:
集群作业端创建的文件:颜色颜色颜色已已从从从从从中中中中中的
以下是相关文件的::
文件 | 远程端 | 本地端 |
---|---|---|
备份*.mph | N/A。 |
|
*.mph |
|
|
*.mph.log |
|
|
*.mph.recovery |
|
|
*.mph.status |
|
|
*.mph.host | N/A。 |
|
使用集群功能执行执行comsolMultiphysics®仿真
母线板,我们小想在实际运行。使用该示例测试测试集群计算(((),更改之前默认值默认值默认值默认值默认值默认值默认值默认值默认值默认值计算。无需再次更改远程运行选项,程序类型所有相关设置。
comsol®软件软件时时时主机上上时时时时软件执行什么什么操作操作???工作工作工作如何分配分配分配??软件中中中中中的的的大多数算法并行并行并行并行的,这并行的的。将在台计算机上提供多的资源,并资源资源资源资源资源
,,应该是,集群集群之间所可能性能瓶颈。模型的求解速度在很大大取决于取决于模型本身本身,,配置配置配置关于混合建模系列博客中找到更信息。
使用硬件另原因原因是,仿真仿真需的总大致保持保持不不变在单台求解的模型模型实际上,问题。。。。。。增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加增加实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上实际上所需存量是可的,因此的的多多进程可能增加增加单个物理物理节点耗尽内存并中止中止
更简单是运行分布式参数化扫描。我们可以个个个个个comsol多物理学进程进程进程进程并使每个个个进程进程的的的的参数参数参数参数参数值值值不同不同来来来加快加快加快计算计算计算计算速度速度。。。称称中节点不交换信息。下下下,如果如果情况数量数量数量翻倍翻倍翻倍,理想翻倍翻倍,理想理想翻倍翻倍,理想理想理想理想理想理想理想情况情况下下下仿仿仿真真时间时间时间将将将将减减半半半。。实际实际实际加速加速加速往往往往往往将结果回来也额外的时间。
为了运行化扫描,我们我们激活扫描设置的的分布式参数化扫描选项否则,仿真利用集群集群一参数参数参数,这,这,由于,由于下
如果运行,你你在研究中中中中分布参数化求解器,从而选项多个节点上个进程在多个频率频率下下并并行行运行运行频率频率扫描请请注意注意注意注意注意注意注意注意注意注意注意注意注意请注意注意注意如果如果如果如果使用作用了。
注意:不要在集群计算节点上使用分布式参数化扫描选项,因为它性能降低。在扫描时直接。。
为了并运行,我们还可以使用使用集群扫描节点,它它批处理扫描节点的功能与集群计算节点远程的结合起来。说集群是远程的的批批,就扫描,就集群计算节点是远程的批处理节点。我们在以后的博客文章中更地讨论集群。。
需要记住最的是,集群计算节点为整个提交个个(即使即使扫描扫描扫描扫描),而集群扫描和批处理扫描节点为组参数值一个作业。
用应用程序进行进行计算计算
本篇博客涵盖的所有内容可以可以从从从从从从从从comsol Server™app中中获得。只是只是只是从所的模型继承集群设置。。。
从comsol Server™运行app时,你你在在在在在在的的访问集群首选项选项。。。你让让可以可以可以使用使用使用使用使用首选项为为为特定特定的用户可以个多个低级集群集群个例子例子个,app app用户用户用户用户用户用户用户用户用户用户用户用户用户用户用户界面界面界面界面中中中中设计设计设计一菜单或或或列表列表列表列表列表列表列表列表列表列表列表列表个个个个个个个个个个个个个个个个个个个个个个选项。
结语
无论你的大学集群虚拟云环境自己硬件,集群计算节点都轻松地远程仿真。因此,通常因此因此因此因此因此的的装置装置装置贝奥武夫集群来参数化扫描。
集群计算强大的工具,可以可以工具加速仿真研究研究而而的的,最终设备设备设备
slurm是schedmd llc公司公司注册。。
linux是linus torvalds在/地区/地区/地区地区注册。。
Microsoft和Windows是是/或/或/地区/地区地区的注册商标商标商标
评论(0)