(资料图片)
近日,英伟达官方公告显示,亚马逊云已正式推出由英伟达H100 Tensor Core GPU驱动的新的亚马逊弹性计算云(EC2)P5实例。该服务允许用户通过浏览器轻松扩展生成式AI、高性能计算(HPC)和其他应用。 NVIDIA H100 GPU的一个重要特点是其对Transformer的优化,这是许多最新的先进AI应用所使用的关键技术,可确保H100在这些应用中提供更高的性能和效率。尽管亚马逊尚未对集成AMD MI300芯片到其云服务中作出任何公开承诺,但亚马逊弹性计算云副总裁Dave Brown证实,他们正在积极考虑这一方案。 英伟达表示,开发人员和研究人员几乎每天都在借助大型语言模型(LLMs)发掘AI的新应用,而将这些新用例推向市场需要加速计算的效率。NVIDIA H100 GPU通过架构创新提供超级计算级性能,包括第四代Tensor Cores、用于加速LLMs的新Transformer引擎以及最新的NVLink技术,可以带来极其可观的性能。 据介绍,EC2 P5实例非常适合训练和运行复杂LLMs和计算机视觉模型的推理。这些神经网络驱动着最复杂和计算密集型的生成式人工智能应用程序,包括问答、代码生成、视频和图像生成、语音识别等。