字节、阿里、智谱、MiniMax集体卡位“春节档”，都在赌一场开年爆款

图片来自视觉中国

蓝鲸新闻 2 月 14 日讯（记者武静静）过去一周，AI 赛道上，谷歌、DeepSeek、智谱、MiniMax、阿里、字节跳动，几乎在同一时间窗口，密集地投下了它们的新一代模型炸弹。

去年是 DeepSeek，今年是谁？AI 大模型的 " 春节档 " 之战

这不是巧合。一年前的此时，DeepSeek V3 的发布意外引爆了全民对 AI 的认知，开启了中国大模型搅动全球算力格局的叙事。让公众第一次意识到中国模型可能改写全球 AI 的成本与算力逻辑。那是一场突发的流量事件。

而一年之后，行业已经学会主动制造这样的时刻。Seedance 2.0 爆火引发全球关注，把视频模型的能力拉上了新高度，之后字节官宣了新的豆包大模型 2.0，谷歌宣布升级 Gemini 2.0 Deep Think，DeepSeek 开始灰度测试上下文提升 10 倍的新版本，智谱推出 744 亿参数的 GLM-5，MiniMax 拿出号称 " 为 Agent 原生设计 " 的 M2.5，阿里的 Qwen-Image-2.0 发布……

这种密集发布背后，是一个行业共识的变化，也是全年叙事权的起点。" 春节这个时间点非常关键。一级市场、二级市场、产业客户，都会在年初重新判断一件事：今年 AI 会不会继续爆发，谁最有可能跑出来。" 一位投资人如是说。

AI 开始有了 " 发布季 "，对于大模型公司来说，技术能力不仅要存在，还必须被市场 " 看到 "。春节前后的时间点，既是用户关注度的高峰，也是资本与产业重新定价的关键阶段。

一位美元基金投资人则将这波发布称为 " 叙事权竞争 "。" 去年是 DeepSeek 意外引爆，今年是大家都不想再把舞台让给别人。" 他表示，大模型行业已经进入头部博弈阶段，技术差距短期内不会出现代际断层，但市场心智会迅速分层。" 去年大家讲的是参数、训练成本、性能。今年大家都在讲 Agent、讲工作流、讲生产力，这说明一个信号：资本开始真正关心商业化，而不是技术想象力。"

这一波热潮中 Seedance 2.0 首当其冲，Seedance 2.0 的核心突破不在画质，而在工作流：自动分镜、自运镜、多镜头叙事、原生音画同步，并支持跨场景一致性。它不再只是文生视频工具，而更接近一个具备 " 导演思维 " 的创作引擎。海外用户的反馈与话题热度，也反映出一个关键变化：视频生成的可控性，已经跨过了实用门槛。马斯克都在 X 评论 "It's happening fast"，游戏科学创始人冯骥在测试后直言 Seedance 2.0 为当前 " 地表最强 " 的视频生成模型，并称 "AIGC 的童年时代结束了 "。目前，字节跳动称 Seedance 2.0 全面接入豆包和即梦产品，同时上线火山方舟体验中心，面向用户开放试用。

在连续发布 Seedance 2.0 视频模型、Seedream 5.0 Lite 图像模型之后，2 月 14 日，字节也宣布推出豆包大模型 2.0（Doubao-Seed-2.0）系列，在数学和推理能力方面，超越了 Gemini 3 Pro 在 Putnam 基准测试上的表现。另外成本方面，其百万 tokens 输入价格仅为 0.6 元，相比 Gemini 3 Pro 和 GPT 5.2 有较大的成本优势。

近日，阿里也发布了千问最新图像模型 Qwen-Image-2.0 支持超长文本输入、复杂指令理解，并能够直接生成 PPT 与信息图，同时具备较强的中文文本渲染能力。其定位已经不再是 " 生成好看的图片 "，而是替代部分设计与内容制作流程。

市场在传阿里的新一代模型 Qwen3.5 也即将发布。有开发者通过代码与社区信息进一步分析认为，Qwen3.5 或将开源至少一个 2B 规模的密集模型，以及一个 35B 级别的 MoE 模型。若相关信息最终落地，意味着阿里在开源生态上的投入力度有望进一步加大。

2026，AI 开始回答同一个问题：能创造什么价值？

过去两年，行业的核心问题是：谁的模型更大、谁的基准分数更高。而 2026 年春节档，各家的发布几乎都在回答同一个问题——模型将如何进入真实生产环境。

谷歌把推理能力做成科研基础设施。升级后的 Gemini 3 Deep Think 被明确定位为 " 推理模式 "，专门面向科学、研究与工程场景，并首次通过 API 向研究人员和企业开放。其在 ARC-AGI-2、Codeforces、IMO 等基准上的表现达到金牌或顶级水平，更重要的是，谷歌强调其在物理、化学等科学问题中的实际能力。这意味着 Deep Think 不再只是能力展示，而是瞄准科研与工程场景的高价值用户群体。

DeepSeek 网页 / APP 正在测试新的长文本模型结构，支持 1M 上下文。而 API 服务不变，仍为 V3.2，仅支持 128K 上下文。此外，市场也砸期待 V4 新模型的到来，野村证券于 2 月 10 日发布报告称，预计 2026 年 2 月中旬推出的 DeepSeek V4 模型，不会重现去年 V3 发布时引发的全球 AI 算力需求恐慌。V4 的核心价值在于通过底层架构创新推动 AI 应用商业化落地。野村进一步指出，V4 预计将引入 mHC 与 Engram 两项创新技术，从算法与工程层面突破算力芯片与内存瓶颈。

MiniMax 和智谱则全面押注 Agent。2 月 12 日，MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5。直接定位为 " 为 Agent 场景原生设计的生产级模型 "，其编程与智能体性能 ( Coding & Agentic ) 直接对标 Claude Opus 4.6，M2.5 模型激活参数量仅 10B，在显存占用和推理能效比上优势明显，支持 100 TPS 超高吞吐量，推理速度超国际顶尖模型。发布新模型当日盘中，MiniMax 涨幅一度超过 20%，总市值超 1800 亿港元。

2 月 11 日，智谱推出了新一代旗舰模型 GLM-5，GLM-5 参数规模扩展至 744B，并强化长程 Agent 任务与复杂系统工程能力，官方称，真实编程环境中的使用体感已逼近 Claude Opus 4.5 水平。此前在全球模型服务平台 OpenRouter 登顶热度榜首的神秘模型 "Pony Alpha" 即为 GLM-5。该模型首次引入 DeepSeek 稀疏注意力机制，在保持长文本处理效果无损的前提下，有效降低部署成本并提升 Token 利用效率。

这更像是一场 " 技术路线的公开展演 "。各家试图回答的，不再只是 " 模型更强 "，而是如何落地的问题。此时，谁能在开年拿出最惊艳的演示、最清晰的技术路线、最落地的应用场景，谁就能在新一年占得先机。

从能力演进来看，行业正在迈向 " 任务智能 "。无论是视频生成的高可控性、图像模型的办公化能力，还是编程模型面向复杂工程场景的高效执行，各家实际上都在回应同一个核心问题：AI 在真实生产流程中究竟能够创造多大价值。下一阶段的竞争，也将从基准成绩与参数规模，转向生产环境中的稳定性、效率与实际反馈——不再是 PPT 上的领先，而是业务流程中的可用性。

从技术趋势看，底层架构创新正在成为新的分水岭。无论是 DeepSeek 围绕系统效率的优化，还是 MiniMax 以 10B 激活参数实现高性能与高吞吐，背后都指向同一方向：通过算法与架构层面的创新，突破算力与内存的物理约束。模型能力的提升，正逐步从 " 堆 GPU" 转向 " 提效率 "。随着推理成本持续下降，应用层的商业探索空间也将随之打开。与此同时，Agent 能力开始从概念层走向执行层。模型不仅能够理解任务，还需要具备拆解复杂目标、持续规划并自主完成的能力。在这一过程中，长上下文、高吞吐、低延迟等工程指标，正在成为决定实际可用性的关键参数。

在多模态方向上，能力同样呈现出明显的工作流化趋势。Seedance 2.0 支持多镜头叙事与自动分镜，使视频模型开始具备类似 " 导演思维 " 的创作能力；Qwen-Image-2.0 则能够根据复杂指令直接生成 PPT 与信息图，图像模型开始理解结构化办公需求。多模态能力正从单点生成工具，向完整生产流程延伸，逐步具备工业化属性。

如果说去年春节前后，DeepSeek 的出圈带有一定偶然性，并意外引爆了市场关注，那么一年之后，行业已经明显进入主动节奏。头部厂商不再等待 " 爆款时刻 "，而是通过集中发布建立阶段性预期与市场认知。

2026 年的这场春节档，或许只是一个开始。接下来，谁能持续拿出真正进入生产环境的能力，才是决定这一轮竞争格局的关键。

宙世代

一起剪

相关标签