随着 DeepSeek 引发全球关注并推动通用人工智能进入新发展阶段,国内人工智能龙头企业科大讯飞 ( 002230.SZ ) 近日也传出重大动向。
证券之星注意到,科大讯飞将在一个月内对其 1 月 15 日发布的基于全国产算力训练的深度推理模型星火 X1,再次进行重大版本升级,这无疑给国产大模型发展再次注入了一剂强心针。
据了解,星火 X1 表现最突出的是中文数学能力,目前已应用于教育和医疗场景。在科大讯飞研究员的演示中,星火 X1 展现出了对复杂问题多步拆解的 " 思维链 " 能力,自我反思能力,并能够针对答案正确与否等反馈信息进行强化训练。
此次星火 X1 的升级意义重大。一方面,此次升级将进一步提升其在数学、教育、医疗、科研等关键领域的性能,巩固其在这些领域的业界领先地位,为行业发展树立新标杆。
另一方面,在 DeepSeek 引发美国对华算力管控趋严的背景下,科大讯飞构建的大模型全栈国产化技术,战略意义和先发优势凸显。全栈国产化实现从硬件到软件、从训练到推理的自主可控,有效降低我国人工智能产业对国外技术的依赖,保障国家人工智能战略安全。
证券之星了解到,大模型的研发和应用,算力是关键支撑。其对算力的需求集中在训练和推理两方面。训练是模型通过海量数据学习获得能力的过程,推理则是利用训练好的模型处理新数据完成任务。
从技术难度来讲,训练难度远超推理,因其数据处理量大、计算复杂度高,对算力平台稳定性和效率要求极高。目前众多国产 GPU 厂商和云计算厂商能提供推理服务,但训练和推理均在国产算力上进行的大模型,讯飞星火算是独一份。
回首科大讯飞在大模型领域的过往,成果亮眼。2024 年 1 月 30 日,科大讯飞推出首个基于全国产算力训练的大模型星火 3.5;2025 年 1 月 15 日,公司又推出首个使用全国产算力训练的深度推理模型星火 X1。
值得一提的是,星火 X1 仅用 1 万张 910B 国产算力卡,就取得了一系列研发成果。这背后是科大讯飞在国产算力平台大量无人区适配和效率优化工作,将国产算力发挥到极致效率,为后续国产大模型适配国产算力开辟了道路。
可以预见的是,随着全国产算力能力提升和应用场景拓展,以科大讯飞星火系列为引领,未来将有更多国产大模型基于国产算力生态涌现,推动我国人工智能产业迈向新高度,在全球人工智能竞争中占据更有利的位置。 ( 本文首发证券之星,作者 | 陆雯燕 )
登录后才可以发布评论哦
打开小程序可以发布评论哦