解密智算时代 " 芯 " 底座背后硬核黑科技。
作者 | 云鹏
编辑 | 漠影
今天,以 DeepSeek 为代表的国产大模型强势突围,引爆大模型落地部署热潮和 AI 应用开发热潮,根据公开数据预测,未来 3 年,推理算力年复合增速将达到训练算力的近 4 倍,算力规模将在 3 年后超过训练算力规模。
推理侧更注重性能、效率与成本的平衡,如何把 AI 推理与业务场景做高效的结合,是当下行业聚焦的重点之一。
在今日刚刚开幕的 RISC-V 中国峰会上,国内芯片设计领域年轻创企知合计算亮出了 " 通推一体 " 的概念,公开了自主设计研发高性能 RISC-V CPU 核的研发进展,并发布通推一体产品 " 阿基米德 " 系列,其目标是通过 RISC-V 架构的高性能通推一体芯片来解决通用计算与 AI 增强计算高效融合的问题,进而真正将 AI 更好地融入到企业的实际业务中。
性能指标层面 " 打破天花板 " 式的突破、兼容性以及生态规范层面的完备支持,都让我们看到 RISC-V 在高性能计算领域所迸发出的巨大潜力。
产品亮相之际,芯东西与知合计算 CEO 孟建熠博士进行了深度交流,对 RISC-V 技术和生态做了进一步挖掘和探讨。
在产品技术创新之外,知合计算高性能 RISC-V CPU 核与通推一体的产品更重要的意义或许是让整个产业看到了一个基于 RISC-V 打造的 " 灯塔级产品 ",进而激励行业共同努力爬坡,给 RISC-V 芯片生态的发展注入新的动力。
01.
AI 推理时代
RISC-V 催生新一代计算芯片无限可能
当下,随着端侧 AI 发展提速,如何把更大、更高质量、效果更好的模型部署在芯片上去做推理,如何把推理能力从云端带向应用?从性能、能效到成本,还有诸多问题需要解决。
在这样的行业背景下,RISC-V 的优势愈发凸显,在孟博看来,RISC-V 首先是一种技术迭代模式上的变化,相比 x86 和 Arm 的 "Inside-Out(由内而外)",RISC-V 更多是 "Outside-In(由外而内)"。
简单来说,RISC-V 更多是从需求的角度出发来改进架构,能跟应用需求走的更近,开发者甚至不需要懂 CPU 设计,就可以对软件进行改进,这是其突出优势之一。
对于芯片厂商和开发者来说,RISC-V 就像一个计算架构底座,在 AI 时代,计算的类型更复杂,开源的 RISC-V 使其可以根据需求进行扩展去设计芯片,更灵活自定义,就如同众多优秀的工程机械都是基于同样的履带式底盘打造。
知合计算的高性能 CPU 核以及基于其上的通推一体 RISC-V 芯片,实际上给了产业一个新的选择,让产业看到基于开源、开放打造的芯片产品同样可以在高性能计算领域拥有不输两大生态的竞争力。
今天的 RISC-V,正在催生新一代计算芯片的无限可能。
02.
冲刺 " 高性能俱乐部 "
打破 RISC-V 性能天花板
从芯片架构到软件算法协同创新
显然,RISC-V 的发展方向是明确的,但实践的道路诚然是不易的。如果以过去的视角来看,RISC-V 或许仍然只是点亮了算力星空中为数不多的几颗星星。
在孟博看来,技术创新是 RISC-V 发展的根本,真正打造出更优秀、更有性价比的 RISC-V 产品才是硬道理,这就像是 " 先有鸡还是先有蛋 " 的问题。
就像今天的 Arm 芯片在很多场景之所以可以跟 x86 掰手腕,就是因为两者在计算能力上的差距越来越小,同时 Arm 的能效比更高、性价比更高、成本大幅降低,企业自然会选择对自身降本增效更有利的方案。
RISC-V 生态想要发展的核心本质还是要做出好的产品,在性价比上形成优势。这是一个 " 螺旋上升 " 的过程:做好了芯片,软件才能移植、优化,生态才能生长,反哺硬件设计,从而形成螺旋上升的良性生态。
从物联网、嵌入式到终端应用场景,再到今天即将拥有 " 高性能俱乐部 " 的入场券,RISC-V 的成长是有目共睹的,业内也对标杆性产品翘首以待。
知合计算的 RISC-V 通推一体芯片,将通用计算和 AI 加速能力高效融合在一款芯片中,这无疑是一次大胆的尝试,其核心要兼顾高性能通用计算和低成本 AI 推理计算。
高性能通用计算方面,从微架构设计到性能和能效的提升,主频每 0.1GHz 的提升都充满挑战;低成本 AI 推理方面,从统一地址、存储访问优化到计算效率的提升,每一环的技术创新都十分关键。
具体来看,知合计算打造了敏捷高效的性能分析与优化平台来支持架构创新:加强了工具链和微架构的模块化架构和扩展性,以实现软硬件敏捷迭代,从而快速评估 RISC-V 架构不断产生的新扩展带来的收益。
同时,知合计算通过统一的图形化性能分析平台,打通了从建模到 RTL 仿真再到原型平台的数据和分析流程,大幅提升了分析优化的效率。而结合模型精度调优,则能给处理器架构和微架构设计提供重要的决策支持。
此外,RISC-V 处理器硬件的快速迭代也对 PPA(性能、功耗、面积)的迭代优化效率提出了要求,为此知合计算打通了软件、架构、设计、综合和物理实现的开发流程体系,实现了快速评估新扩展、新功能 PPA 成本和收益。
可以说,一系列底层技术创新让 RISC-V 架构 CPU 在高性能计算领域应用打下了坚实的基础。
在性能和 PPA 大幅优化基础上,知合计算进一步提升了内核的兼容性,这对后续基于其上构建生态十分重要。其实现了对 RVA23 Profile 的完全兼容,支持 123 个 RISC-V 官方扩展,在兼容性增强技术方面进一步迭代。
在软硬件全系统兼容方面,CPU 核实现了对 RISC-V 系统平台总体规范两个关键子项 100% 的支持率,一个关键子项 97% 的支持率。而在 SoC 和上层软件栈层面,也原生兼容 RISC-V 数十个平台规范和扩展。
具体落到实际的应用场景,知合计算通过一系列指令增强和扩展、流水线架构优化改进、软件算法改进等层面的创新设计,实现了不俗的成绩。
根据实测数据,在视频编解码方面,知合计算基于一系列技术革新,配合软件算法的改进,x264 和 x265 的平均编解码性能能够达到 Intel EMR 和 ARM V2 的 80% 到 90% 以上。
加解密计算方面,知合计算实现了 OpenSSL 典型应用的平均性能分别达到 ARM V2 的 1.6 倍和 Intel EMR 的 1.8 倍。在大模型推理方面,知合计算的 CPU 通过支持 MoE 模型的算子融合,主要算子的平均性能能够达到 ARM V2 的 1.6 倍以上。
而针对低成本 AI 推理计算,知合计算正在重点开发 AME 混合计算架构,这也是高通、阿里达摩院、知合计算、希姆计算等公司主推的方案。数据存储方面,知合计算基于多项技术优化,最终让压缩解压缩和数据校验的性能相比于优化前提升了 2 至 6 倍。
此外,这款处理器采用了全栈的 RISC-V RAS 原生的架构,其整个软硬件平台都支持 RISC-V RERI 规范。通过与合作伙伴在内核、固件和 BMC 上的合作,知合计算将打通从底层硬件到数据中心控制端的整个 RAS 通路,共同提供全系统的 RISC-V RAS 原生架构方案。
安全方面,知合计算的处理器采用了基于 CoVE 的高性能软硬件系统安全平台,内核支持 MPT、CFI、安全调试、Pointer masking 等最新安全特性;软件方面,知合计算开发了配套的 Firmware 和全套安全软件栈。
可以看到,从芯片架构到上层算法、软件的创新,知合计算真正让这款处理器同时兼顾了通用计算和 AI 加速能力,使其具有在高性能计算领域落地和应用的潜力,在打破 RISC-V 芯片性能天花板的同时,无疑给产业带来了极大信心。
03.
首秀惊艳行业跑出中国速度
RISC-V 生态成长仍需产业合力
年轻的知合计算,从成立之初就瞄准了通推一体芯片这一方向,并在团队的努力下很快取得了阶段性成果。
为了实现这一 " 北坡攀登珠峰 " 般的目标,知合计算组建了阵容豪华的团队:董事长严晓浪教授为中国集成电路领域行业泰斗;作为国内 RISC-V 产业领军人物的 CEO 孟建熠博士,是中国 RISC-V 工委会轮值会长,曾任阿里平头哥副总裁;近期加入知合计算的CTO James Jiang 在芯片领域深耕近 30 年,曾在阿里平头哥担任倚天项目负责人。
据了解,公司的核心研发负责人、研发骨干都有着20 年左右的从业经验,此前曾在阿里平头哥、Intel、AMD、联发科、博通和哲库等国内外知名芯片公司任要职。
可以说,强大的核心研发与管理团队是打胜仗的关键支撑。
随着知合计算这样的黑马创企在高性能计算领域趟出 " 通推一体 " 这样新的可行之路,以及越来越多的 RISC-V 芯片创企积极竞争、创新技术,RISC-V 生态必然将更快生长。
不论是在演讲中还是在与孟博的交流中,我们都能清晰的感受到,知合计算并不是想单纯 " 秀肌肉 ",他们更多展示了基于 RISC-V 所做的技术创新以及背后对产业和技术发展的深入思考。
▲孟建熠博士在 RISC-V 中国峰会上演讲
在挑战高性能的这条艰难道路上,有一家公司,通过扎实的底层技术创新,将 RISC-V 的性能天花板抬到一个新的高度,并与国内赛道的玩家一同分享背后的故事,让行业更有信心、更加积极地加入到推动 RISC-V 生态建设的行列中来,这是更为难能可贵的。
当然,这件事不是靠一两家公司短时间就可以实现的,据了解,在知合计算研发高性能 RISC-V 芯片的过程中,从应用场景的实际需求出发,与多家一线云厂商进行了协作,并在 IP 方面与众多合作伙伴保持深度合作。
一款优秀芯片的落地,必然是产业共同努力的结果。
对于 RISC-V 的未来,知合计算的团队充满信心。孟博做了一个形象的比喻:如果 x86 像是占领了几座主要岛屿,那么 RISC-V 的未来可能会是一片大海。在他看来," 三分天下 " 是必然趋势,很可能会在未来 5 到 10 年内实现。
04.
结语:RISC-V 高性能计算崭露头角
中国 AI 算力产业奔涌向前
知合计算高性能 RISC-V CPU 核的公布,给 RISC-V 生态发展注入了助推剂,也让产业看到了 RISC-V 在高性能计算领域加速应用落地的巨大潜力。
今天,国内 AI 算力需求持续增长,算力需求发生结构性变化、推理算力需求增速远超预期,中国 AI 算力产业不断迎来新的机遇和挑战,诸多优秀企业通过技术创新破解算力难题,加速 AI 的产业化落地。
随着 RISC-V 生态的不断完善,越来越多优秀产品的涌现,AI 时代新的算力底座,正在逐渐筑牢。RISC-V 正从过去的 " 点点繁星 " 走向 AI 时代的 " 星辰大海 "。
登录后才可以发布评论哦
打开小程序可以发布评论哦