AI 大模型公司孵出。
作者 | ZeR0
编辑 | 漠影
芯东西 7 月 1 日消息,据《财新》报道,6 月 30 日,由 AI 上市公司商汤孵化的 GPU 公司杭州曦望芯科智能科技有限公司(简称 " 曦望 Sunrise")向《财新》确认完成近 10 亿元融资,投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本和海通开元等。
同日,曦望 Sunrise 公布曦望 S2和曦望 S3两代产品。
曦望 S2 目标实现万片级量产,可部署主流大模型,为企业级 AI 应用提供算力支持,性能对标国际一流产品,软硬件兼容 CUDA 生态,支持主流大模型和 AI 框架。
曦望 S3 为大模型而生,定位为 " 下一代 AI 大模型推理芯片 ",主打极致性价比,宣称推理性能 x 3 倍+,每单位 Token 推理成本降低 90%。
曦望 Sunrise 定位为全栈 AI 算力芯片企业,专注于高性能 GPU 及多模态场景推理芯片的研发与商业化,致力于成为 " 更懂 AI 的芯片公司 "、提供 " 用得起、用得上的顶尖产品 "。
芯东西获悉,曦望 S1 在 2019 年流片成功,是一款DSA 架构的云边推理芯片,累计销售超 2 万颗;曦望 S2 是一款训推一体 GPGPU芯片,采用台积电 7nm 工艺、2.5D CoWoS 封装、64GB HBM2e,TDP 功耗为 350W~450W,在 2023 年 7 月点亮,2024 年已量产 1000 片,即将量产 10000 片;曦望 S3 采用全新芯片架构,预计 2026 年流片。
曦望 S2 加速卡的 FP32/TF32 性能超过同样采用 7nm 工艺的英伟达 A100 SXM、接近 H100 SXM,带宽为 1755GB/s,采用第五代 PCIe 接口(带宽为 128GB/s),C2C 互联带宽为 448GB/s。
同时,曦望 Sunrise 提供全自研的 AI 计算引擎和软件栈,软硬件全面兼容 CUDA,可高效支持常用开源大模型的预训练、微调及训练,支持 Hugging Face 等开源社区的开源大模型工具箱,以及 PyTorch、DeepSpeed 等 AI 框架。
商汤自 2018 年启动 AI 计算原型机预研,2019 年发布 SenseCore AI 大装置原型,并启动自研 AI 芯片项目。今年 5 月 30 日,商汤发公告宣布,其联合创始人徐冰有意专注于推动该公司及其生态体系中战略性新兴业务的发展,并已获任 AI 芯片业务负责人,将致力于推动公司 AI 芯片等新兴业务的突破与成长。
▲商汤 5 月 30 日公告截图
据《财新》报道,曦望 Sunrise 在 2024 年从商汤拆分独立,联席 CEO 王湛曾是百度副总裁,曾参与建立百度搜索推广系统 " 凤巢 ",被称为百度的 " 推广之父 ",于 2016 年 4 月离职。
另一名联席 CEO 王勇曾在 AMD 从事芯片业务,曾在百度昆仑芯担任副总裁,2020 年加入商汤,担任研发总监。
根据曦望 Sunrise 官网,该公司源于 AI 头部企业的孵化,对 AI 软件、算法框架和行业场景应用有着深刻认知,团队兼具顶尖芯片设计经验和 AI 软件开发能力,拥有全自研的指令集、AI 计算引擎和软件栈,可实现芯片在高效计算方面的全自主化。
曦望 Sunrise 提供一站式 AI 算力解决方案,从芯片到系统,涵盖硬件产品、软件栈、算法优化和落地部署的完整 AI 解决方案体系:
硬件产品:推理计算加速卡、服务器、大模型一体机
软件栈:自研 AI 软件栈、CUDA 兼容生态、主流框架支持
算法能力:大模型适配优化、AI 算法平台、场景定制算法
落地服务:全周期工程化部署、技术支持、生态合作
其场景应用包括 AI 大模型推理、综合算力平台、大模型一体机、智能制造、金融服务、智慧医疗与教育。
另据企业公开查询平台企查查,杭州曦望芯科智能科技有限公司成立于 2025 年 6 月,注册资本为 2000 万元,法定代表人是闫嘉宝,由上海阵量智能 100% 持股。上海阵量智能成立于 2020 年 5 月,注册资本为 5 亿元,法定代表人是曦望 Sunrise 联席 CEO 王勇。今年,曦望 Sunrise 已进行两次融资。
▲阵量智能企查查页面中,曦望 Sunrise 融资历程及核心人员介绍(来源:企查查)
登录后才可以发布评论哦
打开小程序可以发布评论哦