近日在南京举办的 2025 全球闪存峰会上,慧荣科技企业级储存事业部产品行销应用部资深协理周宗廉先生发表演讲,阐述了在 AI 浪潮的新时代中,慧荣的企业级存储技术是如何演进的,并在会后接受了快科技的采访。
虽然如今几乎人人言必称 AI,但事实上,AI 已经发展了几十年,也经历了翻天覆地的变化。
早在 1966 年,MIT 麻省理工 AI 实验室就设计了第一个聊天机器人 ELIZA,代码只有 200 行,可以逐字分析人类输入的内容,再重组回复,仿佛和真人聊天。
如今的 AI 人机交互,背后是几十上百亿参数的大模型,而且逐渐变得无所不能。
当然,现代 AI 负载对于硬件性能的要求也是空前的,不仅仅是 CPU 处理器、GPU 加速器,更离不开强大的内存与存储支撑,SSD 的快速发展可以说正逢其时。
慧荣的企业级存储解决方案名为 MonTitanTM,不是单一芯片,而是包含 SSD 主控芯片、参考硬件设计、企业级固件的平台化完整方案。
周宗廉先生解释说,慧荣专注于 IC 设计,自己并不生产 SSD 成品,因此 MonTitanTM 平台本质上是为客户提供参考设计,提供坚实的技术与设计基础,使客户可以更轻松地基于此开发自己的产品,专注于产品定义和市场推广。
慧荣 MonTitanTM 平台的首款产品是 SM8366。
它支持 PCIe 5.0、双端口、NVMe 2.0、OCP 2.5 等各种企业级特性、安全功能,支持最大 256TB 闪存容量。
顺序读取性能超过 14GB/s,随机性能更是超过 350 万 IOPS,能在更快的时间内完成大型模型或者图像化神经网络训练,可以说是真正的企业级主控。
SM8388 是慧荣 MonTitanTM 平台的新成员,支持八通道闪存、最大 128TB 容量、SCA 界面,并延续了 SM8366 的各种优势。
面向未来,慧荣还准备好了 PCIe 6.0 SSD 主控方案 "SM8466"。
它突破性敌采用台积电 4nm 先进制程,支持单个 x4 或者两个 x2 端口,支持最多 16 个闪存通道和 512TB 闪存容量,可搭配 DDR5-7200 规格的大容量高频缓存,还支持 NVMe 2.0+。
性能方面更是突飞猛进,顺序读取能做到 28GB/s 甚至是逼近 30GB/s,4K 随机性能也翻番到了 700 万 IOPS。
在接受采访时,周宗廉先生表示,AI 时代对于存储提出了新的、更苛刻的需求,一是极致性能,就像 NVIDIA 提出的要求往往非常夸张,二是多租户保障,这也是 CSP 云服务厂商的核心诉求,慧荣的 MonTitan? 平台就致力于满足以这两方面为代表的各种需求。
SM83366 主控在设计之初,理念就非常清晰,这是一颗面向 PCIe 5.0 的芯片,因此整个内部架构设计的出发点,就是确保 I/O 吞吐能力可以匹配 PCIe 5.0 的高带宽,必须有能力处理庞大的数据流,为此内部构建了多个专用的高效加速引擎,并做了大量有关数据流控制等方面的优化。
同时,慧荣深入研究了市场上现有相关主控产品的内部架构,并针对性地设计了相应的处理机制,包括如何高效处理来自前端的命令队列、如何根据闪存 Plane 数量进行并行处理等等,从而确保前端的 PCIe 5.0 带宽可以被后端闪存充分利用,避免出现瓶颈。
对于模组厂商等直接客户,慧荣 SM8366 的关键价值在于特别优化的固件架构,使其可以更容易、更高效地使用慧荣主控芯片进行产品设计和量产,降低开发难度和成本。
对于 CSP 等终端客户,极致的性能、能效等技术创新都可以大大提升用户体验,尤其是 Performance Shaping 多租户性能保障技术,可以从硬件层面精细化地隔离和保障不同租户获得相应的、有保障的服务质量,比传统软件层面的控制更加精准,这是很多 CSP 非常看重的地方。
不得不说,如今设计一款优秀的 PCIe SSD 主控是越来越难了,涉及制程、架构、固件、算法等多方面的综合协调与平衡,既要强大的性能、丰富的功能,还要控制功耗、发热和成本。
周宗廉先生认为,其中的关键点可以分为三个层面:
一是先进制程的选择。
采用更先进的制程,比如 6nm、5nm 甚至是 4nm,就能显著降低功耗,因为先进制程的漏电率更低,尤其是高温下漏电飙升的问题可以得到更好的控制,这对功耗优化至关重要,当然,先进制程的成本是非常高昂的。
二是成本控制方法。
为了平衡高昂的制造成本,慧荣的核心策略是最大化减少设计迭代和改版次数,这意味着在芯片流片(Tape-out)前,必须进行极其充分和严谨的系统级验证,所以慧荣在仿真、加速验证等方面投入了大量资源,力求在早期发现并解决问题,避免昂贵的流片失败或改版,这就可以大大节约整体成本。
三是芯片架构设计。
在主控芯片内部,慧荣实现了精细化的功耗管理,比如通过动态开关 ( Power Gating ) 等技术,根据不同的工作负载状态,精准地开启或关闭特定的处理引擎,避免不必要的功耗浪费。
总结来说,打造一颗优秀主控的平衡点在于:通过选择先进制程获得能效优势;投入巨量资源在前期验证上,确保一次成功或最少改版,以摊薄高昂的设计和制造成本;在架构设计上追求高效和智能化功耗管理。
前边说过,慧荣已经拿出了 PCIe 6.0 SSD 主控设计方案,存储行业预计 PCIe 6.0 SSD 今年就有望登场,2026 年开始部署,2028 年左右进入普及阶段。
再下一代的 PCIe 7.0 标准规范刚刚也已经公布,SSD 预计要到 2028 年才会出现,2029 年开始部署。
未来进入 PCIe 6.0、PCIe 7.0 时代,SSD 主控设计必然进一步复杂化,挑战更加严峻。
周宗廉先生认为,挑战主要来自两方面,一是技术挑战,PCIe 6.0/7.0 本身的技术复杂度就是一个巨大挑战,包括信号完整性、速度,这就涉及芯片、系统到 PCB 设计的方方面面。
二是非技术挑战,主要就是成本控制,比如支持 PCIe 6.0/7.0 的制程需要更加先进,这就会导致设计和制造成本变得极其高昂。
对此,慧荣的应对策略的核心是确保一次成功,最大限度减少设计迭代,因此需要在芯片流片前进行前所未有的、极其充分和严格的系统级验证,发现并解决潜在问题。
另外,慧荣在 PCIe 5.0 主控时代良好的积累,也将是应对 PCIe 6.0/7.0 挑战中至关重要的。
周宗廉先生还强调,芯片设计的成本极高,尤其是在先进制程下,因此慧荣的策略是尽量在可控的成本下,将芯片内部的各个引擎做到极致,并通过强大的固件层使,其能灵活适配各种不同的应用场景。
慧荣一直都是持续研究市场需求,结合内部专家的深度讨论和外部信息,在确信存在合理且可观的市场机会时,才会考虑投入相应的解决方案。
这就需要在 " 领先市场半步 " 和 " 避免过度冒险 " 之间找到最好的平衡点,也需要满足更严苛的性能、功耗、集成度要求,确保产品在未来 5-10 年甚至更长时间内保持技术领先。
比如在 PCIe 5.0 主控上,慧荣没有急于抢首发,而是选择了更成熟的时机,推出稳定可靠且的企业级 SM8366 和消费级 SM2508,结果在性能、功耗发热上都表现十分优秀,都得到了市场的广泛接受。
登录后才可以发布评论哦
打开小程序可以发布评论哦