快科技 11 月 18 日消息,今日,蚂蚁集团正式发布全模态通用 AI 助手 " 灵光 ",开创性地在移动端实现 " 自然语言 30 秒生成小应用 ",并且可编辑可交互可分享。
同时,灵光也是业内首个全代码生成多模态内容的 AI 助手。
灵光首批上线三大功能—— " 灵光对话 "、" 灵光闪应用 "、" 灵光开眼 ",支持 3D、音视频、图表、动画、地图等全模态信息输出,对话更生动,交流更高效。
目前,灵光已同步登陆安卓与苹果应用商店。

据介绍," 灵光对话 " 可通过结构化思维,让 AI 回答逻辑清晰、表达简练;通过生成可视化内容,如动态 3D 模型、可交互地图、音视频等,在内容呈现上更灵活。
在教育场景下,用户咨询灵光知识性问题,灵光能够洞察并提炼知识点,有逻辑有层次地展示,并能生成 3D 实物动图、可互动的示意表格等。

这种可秒级生成、又极简多元的可互动回答,背后是灵光实现了基于全代码生成的多模态输出能力。
所有呈现的结果,包括图表、动画,小应用等组件,都是由模型根据对话情境即时生成并呈现给用户。
同时,灵光构建了多智能体协作的 Agentic 架构,能够动态调度图像、3D、动画等专用 Agent 与工具,实时协作,为用户提供更完整、更丰富、更沉浸的视图体验。
值得一提的是,灵光开创性地面向普通用户推出了 " 闪应用 " 功能。
用户在对话中说出或输入一句话,灵光 1 分钟以内、最快 30 秒就能生成一款 AI 应用。
如用户咨询 " 溏心蛋要煮多久?" 灵光可生成一个 " 溏心蛋时间计算器,用户根据实际情况自己选择 " 鸡蛋大小 "" 要求的熟度 " 等条件,自己调整出一个最符合自己情况的答案。
用户想知道怎样养车最划算,灵光可以生成一个 " 养车成本计算器 ",用户自由选择里程、油费等,组合出极具个性化的养车方案。

此外,灵光生成的闪应用不只是静态前端页面,而是可以直接调用大模型等后端能力,让应用不仅能展示结果,更能实时与外部进行交互,显著拓宽可实现的场景边界。
作为一款全模态通用 AI 助手," 灵光开眼 " 功能搭载了 AGI 相机技术,通过实时视频流解析实现对物理世界的观察和理解,并支持文生图 / 视频、图生图 / 视频等多种创作模式。
比如,在旅游场景下,用户用灵光对准想了解的建筑,灵光可以实时 " 看见 " 并讲解。
灵光作为蚂蚁集团 AGI 战略的产品级探索,其核心理念 " 让复杂变简单 ",通过将应用开发嵌入日常对话,重新定义了通用型 AI 助手的生产力边界。
蚂蚁集团 2025 年以来加速 AGI 布局,已发布 AI 医疗管家 AQ、布局具身智能灵波科技,蚂蚁百灵大模型也跻身了万亿参数模型阵营。
灵光的推出,进一步展现了蚂蚁在通用人工智能领域从技术突破到场景落地的全链路能力。


登录后才可以发布评论哦
打开小程序可以发布评论哦