蓝鲸财经 02-14
字节、阿里、智谱、MiniMax集体卡位“春节档”,都在赌一场开年爆款
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

图片来自视觉中国

蓝鲸新闻 2 月 14 日讯(记者 武静静)过去一周,AI 赛道上,谷歌、DeepSeek、智谱、MiniMax、阿里、字节跳动,几乎在同一时间窗口,密集地投下了它们的新一代模型炸弹。

去年是 DeepSeek,今年是谁?AI 大模型的 " 春节档 " 之战

这不是巧合。一年前的此时,DeepSeek V3 的发布意外引爆了全民对 AI 的认知,开启了中国大模型搅动全球算力格局的叙事。让公众第一次意识到中国模型可能改写全球 AI 的成本与算力逻辑。那是一场突发的流量事件。

而一年之后,行业已经学会主动制造这样的时刻。Seedance 2.0 爆火引发全球关注,把视频模型的能力拉上了新高度,之后字节官宣了新的豆包大模型 2.0,谷歌宣布升级 Gemini 2.0 Deep Think,DeepSeek 开始灰度测试上下文提升 10 倍的新版本,智谱推出 744 亿参数的 GLM-5,MiniMax 拿出号称 " 为 Agent 原生设计 " 的 M2.5,阿里的 Qwen-Image-2.0 发布……

这种密集发布背后,是一个行业共识的变化,也是全年叙事权的起点。" 春节这个时间点非常关键。一级市场、二级市场、产业客户,都会在年初重新判断一件事:今年 AI 会不会继续爆发,谁最有可能跑出来。" 一位投资人如是说。

AI 开始有了 " 发布季 ",对于大模型公司来说,技术能力不仅要存在,还必须被市场 " 看到 "。春节前后的时间点,既是用户关注度的高峰,也是资本与产业重新定价的关键阶段。

一位美元基金投资人则将这波发布称为 " 叙事权竞争 "。" 去年是 DeepSeek 意外引爆,今年是大家都不想再把舞台让给别人。" 他表示,大模型行业已经进入头部博弈阶段,技术差距短期内不会出现代际断层,但市场心智会迅速分层。" 去年大家讲的是参数、训练成本、性能。今年大家都在讲 Agent、讲工作流、讲生产力,这说明一个信号:资本开始真正关心商业化,而不是技术想象力。"

这一波热潮中 Seedance 2.0 首当其冲,Seedance 2.0 的核心突破不在画质,而在工作流:自动分镜、自运镜、多镜头叙事、原生音画同步,并支持跨场景一致性。它不再只是文生视频工具,而更接近一个具备 " 导演思维 " 的创作引擎。海外用户的反馈与话题热度,也反映出一个关键变化:视频生成的可控性,已经跨过了实用门槛。马斯克都在 X 评论 "It's happening fast",游戏科学创始人冯骥在测试后直言 Seedance 2.0 为当前 " 地表最强 " 的视频生成模型,并称 "AIGC 的童年时代结束了 "。目前,字节跳动称 Seedance 2.0 全面接入豆包和即梦产品,同时上线火山方舟体验中心,面向用户开放试用。

在连续发布 Seedance 2.0 视频模型、Seedream 5.0 Lite 图像模型之后,2 月 14 日,字节也宣布推出豆包大模型 2.0(Doubao-Seed-2.0)系列,在数学和推理能力方面,超越了 Gemini 3 Pro 在 Putnam 基准测试上的表现。另外成本方面,其百万 tokens 输入价格仅为 0.6 元,相比 Gemini 3 Pro 和 GPT 5.2 有较大的成本优势。

近日,阿里也发布了千问最新图像模型 Qwen-Image-2.0 支持超长文本输入、复杂指令理解,并能够直接生成 PPT 与信息图,同时具备较强的中文文本渲染能力。其定位已经不再是 " 生成好看的图片 ",而是替代部分设计与内容制作流程。

市场在传阿里的新一代模型 Qwen3.5 也即将发布。有开发者通过代码与社区信息进一步分析认为,Qwen3.5 或将开源至少一个 2B 规模的密集模型,以及一个 35B 级别的 MoE 模型。若相关信息最终落地,意味着阿里在开源生态上的投入力度有望进一步加大。

2026,AI 开始回答同一个问题:能创造什么价值?

过去两年,行业的核心问题是:谁的模型更大、谁的基准分数更高。而 2026 年春节档,各家的发布几乎都在回答同一个问题——模型将如何进入真实生产环境。

谷歌把推理能力做成科研基础设施。升级后的 Gemini 3 Deep Think 被明确定位为 " 推理模式 ",专门面向科学、研究与工程场景,并首次通过 API 向研究人员和企业开放。其在 ARC-AGI-2、Codeforces、IMO 等基准上的表现达到金牌或顶级水平,更重要的是,谷歌强调其在物理、化学等科学问题中的实际能力。这意味着 Deep Think 不再只是能力展示,而是瞄准科研与工程场景的高价值用户群体。

DeepSeek 网页 / APP 正在测试新的长文本模型结构,支持 1M 上下文。而 API 服务不变,仍为 V3.2,仅支持 128K 上下文。此外,市场也砸期待 V4 新模型的到来,野村证券于 2 月 10 日发布报告称,预计 2026 年 2 月中旬推出的 DeepSeek V4 模型,不会重现去年 V3 发布时引发的全球 AI 算力需求恐慌。V4 的核心价值在于通过底层架构创新推动 AI 应用商业化落地。野村进一步指出,V4 预计将引入 mHC 与 Engram 两项创新技术,从算法与工程层面突破算力芯片与内存瓶颈。

MiniMax 和智谱则全面押注 Agent。2 月 12 日,MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5。直接定位为 " 为 Agent 场景原生设计的生产级模型 ",其编程与智能体性能 ( Coding & Agentic ) 直接对标 Claude Opus 4.6,M2.5 模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量,推理速度超国际顶尖模型。发布新模型当日盘中,MiniMax 涨幅一度超过 20%,总市值超 1800 亿港元。

2 月 11 日,智谱推出了新一代旗舰模型 GLM-5,GLM-5 参数规模扩展至 744B,并强化长程 Agent 任务与复杂系统工程能力,官方称,真实编程环境中的使用体感已逼近 Claude Opus 4.5 水平。此前在全球模型服务平台 OpenRouter 登顶热度榜首的神秘模型 "Pony Alpha" 即为 GLM-5。该模型首次引入 DeepSeek 稀疏注意力机制,在保持长文本处理效果无损的前提下,有效降低部署成本并提升 Token 利用效率。

这更像是一场 " 技术路线的公开展演 "。各家试图回答的,不再只是 " 模型更强 ",而是如何落地的问题。此时,谁能在开年拿出最惊艳的演示、最清晰的技术路线、最落地的应用场景,谁就能在新一年占得先机。

从能力演进来看,行业正在迈向 " 任务智能 "。无论是视频生成的高可控性、图像模型的办公化能力,还是编程模型面向复杂工程场景的高效执行,各家实际上都在回应同一个核心问题:AI 在真实生产流程中究竟能够创造多大价值。下一阶段的竞争,也将从基准成绩与参数规模,转向生产环境中的稳定性、效率与实际反馈——不再是 PPT 上的领先,而是业务流程中的可用性。

从技术趋势看,底层架构创新正在成为新的分水岭。无论是 DeepSeek 围绕系统效率的优化,还是 MiniMax 以 10B 激活参数实现高性能与高吞吐,背后都指向同一方向:通过算法与架构层面的创新,突破算力与内存的物理约束。模型能力的提升,正逐步从 " 堆 GPU" 转向 " 提效率 "。随着推理成本持续下降,应用层的商业探索空间也将随之打开。与此同时,Agent 能力开始从概念层走向执行层。模型不仅能够理解任务,还需要具备拆解复杂目标、持续规划并自主完成的能力。在这一过程中,长上下文、高吞吐、低延迟等工程指标,正在成为决定实际可用性的关键参数。

在多模态方向上,能力同样呈现出明显的工作流化趋势。Seedance 2.0 支持多镜头叙事与自动分镜,使视频模型开始具备类似 " 导演思维 " 的创作能力;Qwen-Image-2.0 则能够根据复杂指令直接生成 PPT 与信息图,图像模型开始理解结构化办公需求。多模态能力正从单点生成工具,向完整生产流程延伸,逐步具备工业化属性。

如果说去年春节前后,DeepSeek 的出圈带有一定偶然性,并意外引爆了市场关注,那么一年之后,行业已经明显进入主动节奏。头部厂商不再等待 " 爆款时刻 ",而是通过集中发布建立阶段性预期与市场认知。

2026 年的这场春节档,或许只是一个开始。接下来,谁能持续拿出真正进入生产环境的能力,才是决定这一轮竞争格局的关键。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里 谷歌 春节档 投资人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论