微软发布 Azure ND H100 v5 虚拟机,配备 8 个英伟达 H100 GPU

微软发布 Azure ND H100 v5 虚拟机,配备 8 个英伟达 H100 GPU

    正在检查是否收录...

IT之家 11 月 21 日消息,微软 Azure AI 基础设施迎来升级,推出了 ND H100 v5 虚拟机系列,这款虚拟机配备了英伟达 H100 Tensor Core 图形处理单元(GPU)和低延迟网络。

据介绍,微软全新发布 Azure ND H100 v5 虚拟机(VM)系列,现已在美国东部和美国中南部 Azure 区域提供。

该系列配备了最新的英伟达 H100 Tensor Core GPU 和英伟达 Quantum-2 InfiniBand 网络,用于应对 AI 工作负载带来的日益增加的复杂性。作为微软在 AI 领域深入和持续投资的一部分,微软正在利用一个 AI 优化的 4K GPU 集群,并将在明年将其扩展到数十万个全新的 GPU。

IT之家汇总 ND H100 v5 VM 虚拟机系列的特性:

  • AI 超级计算 GPU:

    配备了八个英伟达 H100 Tensor Core GPU。比起上一代虚拟机,该系列可让 AI 模型显著提速。
  • 新一代计算机处理单元(CPU):

    CPU 性能对于 AI 的训练和推理至关重要,微软选择了第四代英特尔 Xeon Scalable 处理器。
  • 低延迟网络:

    采用英伟达 Quantum-2 ConnectX-7 InfiniBand,每个 GPU 拥有 400Gb / s、每个 VM 拥有 3.2 Tb / s 的跨节点带宽。
  • 优化主机到 GPU 的性能:

    通过 PCIe Gen5 提供每个 GPU 64GB/s 的带宽。
  • 大规模的内存和内存带宽:

    DDR5 内存是该系列虚拟机的核心,提供更高的数据传输速度和效率。

微软表示,该系列虚拟机使用新的 8 位 FP8 浮点数据类型进行矩阵乘法操作时,速度提升了六倍,比前一代的 FP16 更快。ND H100 v5 VM 帮助大型语言模型(如 BLOOM 175B 端到端模型)实现了最高两倍的推理速度提升。

gpuazurecpu语言模型llm大型语言模型ai 模型基础设施url端到端
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-1124.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

OpenAI 危机:奥特曼被解雇 员工大规模外流至微软

上一篇

LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务)、同

下一篇
  • 复制图片
按住ctrl可打开默认菜单