链载Ai
标题: H200与H100的区别是什么 [打印本页]
作者: 链载Ai 时间: 4 小时前
标题: H200与H100的区别是什么
不知道大家是否有这样的疑惑,当前H100是NVIDIA Hopper架构主力供货机型,而且在今年3月的GTC大会上,黄仁勋也发布了下一代Blackwell架构的B100 GPU,为何这时候还会有同架构的H200上市呢?H200相对于H100,最主要的升级在于显存,得益于141GB的HBM3e显存,H200显存带宽达到了4.8TB/s,使得H200的推理速度达到了H100的两倍。.()8TB/s of memory bandwidthingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">从图中可以明显的看出,H200与H100在算力参数上完全一致,甚至功率都一样,唯一的差别就在GPU显存上,H200采用的GPU显存是HBM3e,而H100是HBM3,这就导致H200的GPU 显存直接从80GB增加到了141GB,几乎翻倍,而显存带宽从3.35TB/s增加到了4.8TB/s,是H100的1.4倍。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">在不断发展的人工智能领域,企业依靠大型语言模型来满足各种推理需求。LLM企业在大规模部署推理服务器时,需要以最低的TCO实现最高的吞吐量。从NVIDIA提供的官方测试报告可以看出,H200的推理性能提到大幅度提升,Llama2 70B模型下,可以达到H100的两倍。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">显存带宽对于高性能计算(HPC)应用至关重要
,它可以加快数据传输速度并减少复杂数据处理的瓶颈。对于内存密集型的HPC应用,如仿真模拟、科学研究和人工智能,H200的更高内存带宽确保了数据可以高效地被访问和操作,从而实现结果生成时间快110倍。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">同时,NVIDIA也发布了GH200(H200+Grace CPU)的芯片参数。来看一下整体的架构。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">NVIDIA Grace Hopper 架构将 NVIDIA Hopper GPU 的开创性性能与 NVIDIA Grace CPU 的多功能性结合在单个超级芯片中,通过高带宽、内存一致性的 NVIDIA NVLink 芯片到芯片(C2C)互连进行连接。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">NVIDIA NVLink-C2C 是一种用于超级芯片的内存一致性、高带宽、低延迟的互连技术。NVLink-C2C在CPU和GPU之间提供了高达900GB/s的总带宽,是加速系统中常用 PCIe Gen5 通道的7倍。NVLink-C2C 使应用程序能够使用 GPU 的显存,并直接以高带宽使用 Grace CPU 的内存。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">每个 GH200 Grace Hopper 超级芯片拥有高达480GB的LPDDR5X CPU内存。GH200可以轻松部署在标准服务器中,运行各种推理、数据分析以及其他计算和内存密集型工作负载。GH200还可以与 NVIDIA NVLink 交换机系统结合使用,所有 GPU 线程在多达256个 NVLink 连接的 GPU 上运行。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">Grace CPU:目前NVIDIA Grace CPU 是世界上最快的 Arm数据中心 CPU。Grace CPU 旨在实现高单线程性能、高内存带宽和出色的数据移动能力。NVIDIA Grace CPU 结合了72个 Neoverse V2 Armv9 核心和高达480GB的服务器级 LPDDR5X 内存,带有ECC(纠错码)。这种设计实现了带宽、能效、容量和成本之间的最佳平衡。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">NVLink-C2C 内存一致性:内存一致性提高了开发者的生产力、性能和 GPU 可访问内存的数量。CPU 和 GPU 线程可以同时且透明地访问 CPU 和 GPU 驻留的内存,允许开发者专注于算法而非显式内存管理。内存一致性让开发者只传输所需的数据,而不是将整个页面来回迁移到 GPU。它还通过允许 CPU 和 GPU 的原生原子操作,提供了 GPU 和 CPU 线程之间的轻量级同步原语。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">对于 AI 推理工作负载,GH200 Grace Hopper 超级芯片与 NVIDIA 网络技术结合,为扩展解决方案提供最佳的 TCO(总体拥有成本),让客户可以使用高达624GB的快速访问内存来处理更大的数据集、更复杂的模型和新的工作负载。
NVIDIA GH200 还提供双 GH200 配置,两个 Grace Hopper 超级芯片通过 NVLink 完全连接,提供 288GB 的 HBM3e 和 1.2TB 的快速内存,用于计算和内存密集型工作负载。
| 欢迎光临 链载Ai (https://www.lianzai.com/) |
Powered by Discuz! X3.5 |