阿里、智谱等扎堆发布大模型编程、金融等方向成焦点

《科创板日报》7 月 30 日讯（记者黄心怡）近期的大模型圈子，可谓是热闹非凡。

自 7 月 22 日以来，阿里巴巴接连开源了四个模型，分别涉及基础模型、编程模型、推理模型和视频模型等，包括开源视频生成模型通义万相 2.2、千问 3 最新版基础模型（非思考版）、千问 3 推理模型以及 AI 编程模型 Qwen3-Coder。

在 7 月 28 日，蚂蚁数科、智谱 AI 也相继发布大模型，聚焦垂类赛道。

其中，蚂蚁数科发布的金融推理大模型 Agentar-Fin-R1，包括 32B 和 8B 参数两个版本。蚂蚁数科还推出基于百灵大模型的 MOE 架构模型，以及非推理版本的 14B 和 72B 参数大模型。智谱 AI 则发布新一代旗舰模型 GLM-4.5，专为智能体应用打造。此外，月之暗面也于本月开源并发布了 MoE 架构基础模型 Kimi K2。

《科创板日报》注意到，编程能力成为多个企业的重点提升方向。比如，Kimi K2 强调具备更强代码能力。在前端开发任务中，Kimi K2 擅长生成兼具设计感与视觉表现力的代码，支持粒子系统、可视化和 3D 场景等表现形式。Kimi K2 One-shot 可在无具体指令下，自动选用 TradingView，搭建了完整的期货交易系统界面。

智谱 AI 发布的 GLM-4.5 则首次在单个模型中实现推理、编码和智能体能力的原生融合，满足智能体应用的复杂需求。

阿里的 Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型，支持 Agent 调用各种工具，解决复杂编程任务，实现网页开发、AI 搜索、深度研究等智能体应用。

今年早些时候，Anthropic 的创始人、CEO Dario Amodei 曾预测，距离 AI 编写 90% 代码的时代已经不远了。再过一年，AI 甚至可能编写所有的代码。

" 今年的 AI 编程变得更好用了，相比去年成功率大涨。" 在 2025 世界人工智能大会 AI 女性菁英论坛上，宇树科技创始人王兴兴谈及 AI 时表示， "现在我很多代码都偷懒不写了，交给大语言模型来写。去年的成功率还不高，会有很多错误。而今年，比如生成一个抽奖的软件，成功率可以达到 90% 以上，这大大降低了科学研究、AI 软件算法的难度。"

对于 AI 编程的发展趋势，阿里云百炼高级产品专家徐志远在接受《科创板日报》采访时表示，AI 并不是要替代某种角色，程序员的每层工作本身都没有消失，改变的是完成工作的某一种方式。在如今的模型发展趋势下，重新思考利用新的技术、新的模型、新的编程的范式来达到目标。

" 甚至某种意义上，可能在未来会进一步的淡化程序员初级、中级、高级等的层级概念。对 AI 工具的理解程度，对 vibe coding（氛围编程）的接受程度、对 Coder 模型的使用程度，甚至对模型进步、下一代趋势发展的判断程度，决定了产出的高和低。而不是传统的有十年、三年或者一年代码经验，做过多么深度的项目。今年有大量的初创团队可能只有那么一两名程序员，但能够非常深刻理解和使用新型 AI 工具，来构建出非常令人惊艳的项目。"

除了编程外，金融大模型是一大重要垂类方向。蚂蚁数科 CEO 赵闻飙认为，通用大模型距离产业实际应用通常存在 " 知识鸿沟 "。构建专业的金融大模型是推进金融与 AI 深度融合的必然路径，未来，金融大模型的应用深度将成为金融机构竞争力的关键要素。

蚂蚁数科 CTO 王维在接受《科创板日报》采访时表示，金融行业把 AI 用好依然面临很多挑战。" 金融在 AI 场景中遇到很多的幻觉和差错，或者回答未达到金融级审慎的要求，如果把 AI 用好，不得不面临一个挑战，如何把通用能力和场景鸿沟弥合。所以我们选择从通用大模型向专业 / 专用模型演进。"

王维判断，金融推理模型会越来越被需要，因为金融类复杂场景的业务，需要模型的整个推理链条和推理逻辑都很清晰，才能真正解决问题。

"一个好的垂直大模型，特别是推理能力很强的大模型，才能成为智能体可控、可靠、可优化的智能中枢。没有这个东西，就像缺少关键的齿轮，导致其他的齿轮带不动。如果推理模型的泛化能力、意图识别能力、结构化表达的能力都不在线，很难相信企业愿意用这样新的技术方式取代原有的业务模式，更不能谈增量价值的创造了。"

宙世代

一起剪

相关标签