AI 算力芯片股迎来历史性狂欢。
作者 | ZeR0
编辑 | 漠影
DeepSeek 不出手则已,一出手便轰动国产智算产业。
智东西 8 月 22 日报道,在 DeepSeek-V3.1 正式发布并放出 " 针对即将发布的下一代国产芯片设计 " 讯息后,今日国内 AI 芯片概念股一片飘红,寒武纪、海光信息、云天励飞、科德教育(杭州 AI 芯片企业中昊芯英股东)纷纷以 20% 涨停,多只股票股价创 60 日新高。
寒武纪尤其势头凌人,股价首次突破 1000 元大关,市值首度突破 5000 亿元大关,超越海光信息、中芯国际登顶科创板市值榜,开创国产 AI 芯片新里程碑。
其最新价冲到 1243.20 元 / 股,与贵州茅台仅差 220 元。
这一切源自沉寂 2 个月 23 天之久的杭州大模型企业 DeepSeek,昨日正式发布新一代大模型 DeepSeek-V3.1,宣布该模型在需要多步推理的复杂搜索测试与多学科专家级难题测试上,性能已大幅领先于今年 5 月发布的 DeepSeek-R1-0528,并放出跟下一代国产 AI 芯片有关的重磅消息:
"DeepSeek-V3.1 使用了UE8M0 FP8 Scale 的参数精度。"
"UE8M0 FP8 是针对即将发布的下一代国产芯片设计。"
开源页面显示,DeepSeek-V3.1 模型 " 使用 UE8M0 FP8 scale 数据格式进行训练,以确保与Microscaling数据格式的兼容性 "。
Hugging Face地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
消息一出,AI 算力产业一片哗然。
AI 芯片设计的核心目的是加速 AI 计算。模型由参数组成,参数用的位数越多,计算越准确,但对应也更加费时低效。业界一直在探索通过采用较低精度,在不显著牺牲模型性能的情况下减少内存和带宽的使用,提高计算速度。FP8 表示位宽位 8 的二进制浮点数。相比 FP32/FP16,FP8 能减少 50%-75% 的内存占用。
FP8 有多种表示方式,包括 E5M2、E4M3、E3M4、E2M5 等。DeepSeek 提到的 "UE8M0" 是 FP8 的一种变体,"U" 指无符号位,"E8" 是 8 位指数,"M" 指尾数位。"M0" 通过去尾数可减少位宽占用,压缩内存开销。UE8M0 用在 Scale 能够补偿精度。
这种策略既能实现更极致的计算效率和节省存储资源,又能优化对国产 AI 芯片的适配,使大模型能在国产芯片上稳定运行,缩小与国际先进芯片的实际差距。
而 DeepSeek 预告的 " 即将发布的下一代国产芯片设计 ",更加引人遐想。
目前仅少数 AI 芯片支持 FP8。英伟达是从 Hopper 架构 Tensor Core 开始支持 FP8。国内摩尔线程 MTT S5000、燧原科技燧原 L600等 AI 芯片产品已原生支持 FP8 低精度格式。根据招股书,沐曦股份在研的曦云 C600 也将支持 FP8 格式。
其中摩尔线程 MTT S5000 GPU 已大规模量产。据介绍,其 MUSA 架构能很好支持 UE8M0 FP8 Scale,利用硬件原生 FP8,相对于传统的 FP16 计算可实现 2 倍的浮点算力提升、访存和通信带宽效率提升和存储容量利用率提升,同时最优化张量表达精度。
华为、寒武纪、海光信息等企业的下一代 AI 芯片也可能支持 FP8。
自今年开年以来,DeepSeek 一直在给国内 AI 芯片产业及生态的发展踩油门。
今年 2 月,在 DeepSeek 爆火后,华为昇腾、沐曦股份、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能、芯动力科技、墨芯、后摩智能、瀚博、爱芯元智、芯瞳、进迭时空、江原科技、奕斯伟计算等国内 AI 芯片公司相继宣布适配或上架 DeepSeek 模型服务。
8 月,中国信通院发布 AISHPerf 基准 DeepSeek 大模型适配测试结果,首批通过 DeepSeek 适配测试的企业有 8 家,分别是中国电信、华为、寒武纪、昆仑芯、海光、沐曦、中昊芯英、中科嘉禾,其中华为、寒武纪、昆仑芯、海光、沐曦、中昊芯英均有自研 AI 芯片。
中国信通院通过开展 DeepSeek 适配测试工作发现:
在适配支持性方面,通过软硬件协同优化,我国参测产品部署 DeepSeek 模型在语言理解、逻辑推理等典型任务中的精度已基本与国外系统持平。
在部署环境方面,我国已有系统实现单机 8 卡推理 DeepSeek 671B 满血版模型(INT8/FP8 精度),与英伟达所需硬件规模持平,大部分国产设备需两机 16 卡或四机 32 卡完成同参数量模型部署。
在产品形态方面,硬件芯片、框架平台、云服务等产业链关键主体均积极推动适配工作。国内厂商能够在短时间内完成在软硬件系统上运行无报错的基础适配,目前适配重点主要集中在产品功能及面向业务场景性能的调优阶段。
DeepSeek 的产业号召力显而易见,其新一代模型支持 FP8 精度和国产芯片,将推动国产芯片与 AI 模型的适配,对国产算力芯片落地与生态发展起到极为积极的催化作用。
受此激励,今日,寒武纪、海光信息、中科曙光、云天励飞、科德教育等 5 只 AI 算力芯片股集体涨停。
北京 AI 芯片上市公司寒武纪今日 20% 涨停,最新市值达到 5200.93 亿元,在科创板市值榜排名第一。该公司今年 7 月宣布拟向特定对象发行股票募资 39.85 亿元,用于面向大模型的芯片平台项目、软件平台项目和补充流动资金。2025 年第一季度,寒武纪营收为 11.11 亿元,归母净利润为 3.55 亿元,实现盈利。
国产 CPU 及 GPU 龙头海光信息今日 20% 涨停,最新市值为 4324.66 亿元,位列科创板市值榜第二。海光信息 2025 年上半年营收为 54.64 亿元,归母净利润为 16.39 亿元。今年 5 月,海光信息发公告宣布拟吸收合并国产服务器大厂中科曙光。今日中科曙光也以 10% 涨停,最新市值为 1211.90 亿元。
深圳 AI 芯片上市公司云天励飞同样今日飙涨 20%,在 7 月世界人工智能大会期间宣布全面聚焦 AI 芯片,并已于 7 月 30 日递表港交所。
油墨上市公司科德教育近年来一直在谋求转型,除了切入教育赛道外,还在 2023 年以 1.3 亿元对杭州 AI 芯片创企中昊芯英进行增资及股权收购,截至今年 4 月持有中昊芯英 5.99% 的股权。中昊芯英 2024 年营收为 5.98 亿元,归母净利润为 8590.78 万元。
另一家跟中昊芯英相关的上市公司天普股份,今日开盘即封死涨停板。天普股份昨日发公告宣布其控股股东天普控股、天昕贸易、尤建义拟合计向中昊芯英转让 10.75% 股份,将使中昊芯英和海南芯繁合计持有天普控股 50.01% 的股份,中昊芯英创始人杨龚轶凡将成为天普股份的实际控制人。
持有北京 GPU 企业摩尔线程 1.244% 股份的和而泰,今日股价上涨超过 10%。
其他国产芯片股亦闻风而涨:恒烁股份涨 13.30%,景嘉微上涨 10.00%,澜起科技上涨 8.70%,龙芯中科上涨 7.30%,复旦微电上涨 6.65%,天德钰上涨 6.13%,瑞芯微上涨 5.42%,国芯科技、炬芯科技、翱捷科技等涨超 4%,北京君正、全志科技、航宇微等涨超 3%,晶晨股份、星宸科技、国科微等涨超 2%……
算力股的暴涨不仅是对 DeepSeek 技术突破的短期反应,还体现了市场对国产 AI 技术生态长期发展的信心。随着更多国产先进模型及 Agent 应用加速普及、多地政策加大对国产算力支持力度、国产替代进程加速,国产 AI 算力基础设施产业链将迎来更广阔的发展空间。
登录后才可以发布评论哦
打开小程序可以发布评论哦