阿里云弹性高性能计算 E-HPC

阿里云服务器

阿里云弹性高性能计算(E-HPC)是一种基于阿里云基础设施的高性能计算服务。它利用第三代英特尔至强可扩展处理器和英特尔oneAPI工具套件,提供公有云、专有云等多种产品形态,为用户提供一站式HPC/HPDA平台服务。

E-HPC主要面向科研、生产、教育和行业大计算等领域,提供快捷、弹性、安全的服务,并与阿里云的其他产品互通。其特点包括:

自动伸缩:根据需求或任务队列使用率,E-HPC可以自动识别节点的负载情况,并动态调整云上资源。

混合云渲染:在混合云环境下,利用E-HPC及其文件缓存机制,可以构建云上云下一体化的渲染服务。

动态审计:基于HPC调度器作业实际运行情况,从用户、队列、节点等多维度生成集群资源报表,动态查看云上集群资源利用情况。

混合调度:通过E-HPC可以创建HPC混合云集群,利用本地的HPC集群在阿里云扩容计算资源,统一调度云上资源和本地资源进行高性能计算。

弹性集群管理:按需组建云上HPC集群,无需排队,自主增减节点及升降配。

此外,E-HPC还提供可扩展的HPC软件栈,覆盖从操作系统、集群管理、任务调度到行业应用的多层次需求。它支持基于阿里云ECS、EGS弹性计算实例、VPC专有网络、NAS存储实例快速构建任意规模的并行计算集群,并根据用户需求动态增删节点个数和存储规模。

总的来说,阿里云弹性高性能计算(E-HPC)是一种功能强大、灵活可扩展的高性能计算服务,适用于各种科研、生产、教育和行业大计算场景。

阿里云弹性高性能计算(E-HPC)的使用流程大致包括以下几个步骤:

创建集群:首先,需要在E-HPC控制台中创建一个集群,这个集群将作为后续提交、调试、运行作业的基础。可以根据需要选择计算节点的规格和数量,并配置相关的网络和安全设置。

创建用户:在集群创建完成后,需要创建用户,用于在集群中提交作业时标识身份。创建成功后,可以使用该用户管理集群、提交作业等。

上传作业文件:在提交作业之前,需要将作业文件上传到集群中。可以通过E-HPC控制台选择OSS(对象存储服务)中的作业文件,或者直接在集群中通过命令行上传文件。

配置作业参数:在提交作业前,需要配置作业参数,包括指定运行的集群、作业名称、作业类型、运行命令等。这些参数将决定作业的运行方式和资源分配。

提交作业:配置完作业参数后,可以提交作业到集群进行执行。在提交作业时,需要输入集群用户名和密码进行身份验证。提交成功后,作业将开始执行。

查看作业结果:在作业执行过程中或执行完成后,可以在E-HPC控制台查看作业的运行状态和结果。也可以远程连接到集群,直接查看作业输出的结果文件。

除了以上基本流程外,还可以根据需要对集群进行更多的管理操作,如创建队列、管理节点、配置网络等。这些操作都可以通过E-HPC控制台或命令行工具进行。

需要注意的是,具体的使用流程可能会因版本更新或功能变化而有所差异。因此,在实际使用过程中,建议参考最新的阿里云E-HPC文档或官方教程进行操作。

阿里云弹性高性能计算(E-HPC)的产品优势主要体现在以下几个方面:

弹性伸缩:E-HPC能够根据需求或任务队列使用率,自动识别节点的负载情况,并动态调整云上资源。当没有作业排队时,可以自动缩容到配置的最小节点数量,以节约资源。当有作业提交到调度器队列后,又可以自动创建相应数量的节点进行计算,确保计算资源的高效利用。

数据安全:E-HPC通过基于专有网络VPC实现的网络访问隔离,以及安全组防火墙进行的三层网络访问控制,充分保证了集群网络的安全性。同时,集群数据保存在阿里云文件存储NAS中,利用NAS的传输加密与存储加密特性,保障集群数据不被窃取或篡改。

高可用性:E-HPC的集群节点基于云服务器ECS、超级计算集群SCC和GPU云服务器组建,大大提高了集群的可用性。此外,E-HPC还提供混合云渲染和混合调度功能,可以在混合云环境下构建云上云下一体化的渲染服务,并利用本地的HPC集群在阿里云扩容计算资源,统一调度云上资源和本地资源进行高性能计算。

软件管理服务:E-HPC提供方便的软件管理服务,覆盖HPC应用全部支撑软件栈功能,并随HPC共同体(OEM/OSV/ISV/用户/开发者/开源社区)版本升级。此外,E-HPC还提供云端Elastic License的按需付费的软件许可证调度机制,为用户节约一次性购买成本,同时为ISV软件厂商和个人软件开发者提供了阿里云市场的新途径。

灵活的计算节点选择:E-HPC是一个组合型产品,其计算节点有普通ECS实例、GPU加速EGS实例、超级计算集群SCC实例可供选择。这些实例类型可以满足不同场景和需求下的高性能计算任务。

综上所述,阿里云弹性高性能计算(E-HPC)的产品优势主要体现在弹性伸缩、数据安全、高可用性、软件管理服务和灵活的计算节点选择等方面。这些优势使得E-HPC成为了一个功能强大、灵活可扩展的高性能计算服务,适用于各种科研、生产、教育和行业大计算场景。