25年,HBM4 内存相比 HBM3有哪些新的技术突破与设计改进?
HBM4 内存相比 HBM3,在带宽提升和延迟降低方面,采用了哪些新的技术突破与设计改进?HBM3 的接口宽度为 1024 位,而 HBM4 升级到了 2048 位。这使得 HBM4 一次传输的数据量是 HBM3 的两倍 例如 HBM3 一次可发送 128 字节数据,HBM4 则可发送 256 字节数据,从而直接提升了带宽 HBM3 的数据传输速率为 6.4Gb/s,HBM4 则提升至 8Gb/s,更高的传输速率使得每秒能够处理更大的数据传输量,进一步增加了带宽。 通道数量增加,HBM4 将每个堆栈的独立通道数量从 HBM3 的 16 个增至 32 个,每个通道还包含 2 个伪通道,这为设计人员提供了更大的灵活性和访问立方体的独立方式,显著提高了并发数据传输的能力,进而提升了带宽。 命令总线和数据总线分离,HBM4 引入了命令总线和数据总线分离的设计,这种架构改进旨在增强并发性,减少数据传输过程中的等待时间,从而降低延迟,提高多通道操作的性能,这在 AI 和 HPC 工作负载中非常重要。 物理接口改进和信号完整性优化,HBM4 采用了全新的物理接口并改进了信号完整性,以支持更快的数据速率和更高的通道效率,有助于减少信号传输的延迟和干扰,提高数据传输的稳定性和速度。 增加堆栈层数,HBM4 支持的堆栈层数从 HBM3 的最多 12 层增加到了最多 16 层,更多的层数意味着更多的 I/O 接口,这有助于减少数据传输的延迟,尤其是在多处理器或多 GPU 系统中,可以更高效地进行数据交换 容量提升,HBM4 支持从 4 层到 16 层的堆栈配置,DRAM 芯片密度为 24Gb 或 32Gb,使用 32Gb 16 层堆栈的立方体容量高达 64GB,而 HBM3 的容量相对较小,HBM4 更大的容量为苛刻的工作负载提供了更高的内存密度,能更好地满足不同应用场景对存储容量的多样化需求。 能效优化,HBM4 支持多种供应商特定电压水平,包括 VDDQ 选项为 0.7V、0.75V、0.8V 或 0.9V,以及 VDDC 选项为 1.0V 或 1.05V。这些调整有助于降低功耗并提高不同系统需求的能源效率,相比 HBM3 在能效方面有了进一步提升。 兼容性增强,HBM4 接口定义确保了与现有 HBM3 控制器的向后兼容性,允许在各种应用中实现无缝集成,并且支持单个控制器在需要时同时与 HBM3 和 HBM4 一起工作,这为系统升级和维护提供了更大的灵活性。
		页: 
[1]