《科创板日报》7 月 30 日讯(记者 黄心怡)近期的大模型圈子,可谓是热闹非凡。
自 7 月 22 日以来,阿里巴巴接连开源了四个模型,分别涉及基础模型、编程模型、推理模型和视频模型等,包括开源视频生成模型通义万相 2.2、千问 3 最新版基础模型(非思考版)、千问 3 推理模型以及 AI 编程模型 Qwen3-Coder。
在 7 月 28 日,蚂蚁数科、智谱 AI 也相继发布大模型,聚焦垂类赛道。
其中,蚂蚁数科发布的金融推理大模型 Agentar-Fin-R1,包括 32B 和 8B 参数两个版本。蚂蚁数科还推出基于百灵大模型的 MOE 架构模型,以及非推理版本的 14B 和 72B 参数大模型。智谱 AI 则发布新一代旗舰模型 GLM-4.5,专为智能体应用打造。此外,月之暗面也于本月开源并发布了 MoE 架构基础模型 Kimi K2。
《科创板日报》注意到,编程能力成为多个企业的重点提升方向。比如,Kimi K2 强调具备更强代码能力。在前端开发任务中,Kimi K2 擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和 3D 场景等表现形式。Kimi K2 One-shot 可在无具体指令下,自动选用 TradingView,搭建了完整的期货交易系统界面。
智谱 AI 发布的 GLM-4.5 则首次在单个模型中实现推理、编码和智能体能力的原生融合,满足智能体应用的复杂需求。
阿里的 Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型,支持 Agent 调用各种工具,解决复杂编程任务,实现网页开发、AI 搜索、深度研究等智能体应用。
今年早些时候,Anthropic 的创始人、CEO Dario Amodei 曾预测,距离 AI 编写 90% 代码的时代已经不远了。再过一年,AI 甚至可能编写所有的代码。
" 今年的 AI 编程变得更好用了,相比去年成功率大涨。" 在 2025 世界人工智能大会 AI 女性菁英论坛上,宇树科技创始人王兴兴谈及 AI 时表示, "现在我很多代码都偷懒不写了,交给大语言模型来写。去年的成功率还不高,会有很多错误。而今年,比如生成一个抽奖的软件,成功率可以达到 90% 以上,这大大降低了科学研究、AI 软件算法的难度。"
对于 AI 编程的发展趋势,阿里云百炼高级产品专家徐志远在接受《科创板日报》采访时表示,AI 并不是要替代某种角色,程序员的每层工作本身都没有消失,改变的是完成工作的某一种方式。在如今的模型发展趋势下,重新思考利用新的技术、新的模型、新的编程的范式来达到目标。
" 甚至某种意义上,可能在未来会进一步的淡化程序员初级、中级、高级等的层级概念。对 AI 工具的理解程度,对 vibe coding(氛围编程)的接受程度、对 Coder 模型的使用程度,甚至对模型进步、下一代趋势发展的判断程度,决定了产出的高和低。而不是传统的有十年、三年或者一年代码经验,做过多么深度的项目。今年有大量的初创团队可能只有那么一两名程序员,但能够非常深刻理解和使用新型 AI 工具,来构建出非常令人惊艳的项目。"
除了编程外,金融大模型是一大重要垂类方向。蚂蚁数科 CEO 赵闻飙认为,通用大模型距离产业实际应用通常存在 " 知识鸿沟 "。构建专业的金融大模型是推进金融与 AI 深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。
蚂蚁数科 CTO 王维在接受《科创板日报》采访时表示,金融行业把 AI 用好依然面临很多挑战。" 金融在 AI 场景中遇到很多的幻觉和差错,或者回答未达到金融级审慎的要求,如果把 AI 用好,不得不面临一个挑战,如何把通用能力和场景鸿沟弥合。所以我们选择从通用大模型向专业 / 专用模型演进。"
王维判断,金融推理模型会越来越被需要,因为金融类复杂场景的业务,需要模型的整个推理链条和推理逻辑都很清晰,才能真正解决问题。
"一个好的垂直大模型,特别是推理能力很强的大模型,才能成为智能体可控、可靠、可优化的智能中枢。没有这个东西,就像缺少关键的齿轮,导致其他的齿轮带不动。如果推理模型的泛化能力、意图识别能力、结构化表达的能力都不在线,很难相信企业愿意用这样新的技术方式取代原有的业务模式,更不能谈增量价值的创造了。"
登录后才可以发布评论哦
打开小程序可以发布评论哦