实测完“灵光”，我意识到人类对 AI 助手的开发不足1%

今天的朋友圈，被一款叫「灵光」的 APP 刷屏了。

了解了一下，这是一款来自蚂蚁集团的 AI 应用，定位是面向普通人的零门槛全模态 AI 助手，还可以自然语言 30 秒生成可互动的小应用。这让我想到了还在预热，这周即将发布的 Gemini3.0，一句话生成操作系统，这都给了我们一个无限想象力的画面。未来，AI 生成的边界是什么？

今年以来， AI 助手领域有个明显的课题：如何让 AI 的生成能力涌现。

从 OpenAI、谷歌，到国内的豆包、阿里千问，涌现了很多新产品，如今，AI 的能力卷到帮你做网页、做视频都显得有些平常。各个头部公司，不仅在尝试用简洁聪明的 AI 助⼿，替代操作复杂的传统应用，更在探索更多的可能性。

我决定也从这个标准切入，测试灵光 APP 的产品涌现能力。

第一步先登录，登录页面非常极简，灵光的 Slogan：让复杂，变简单。

什么是复杂的？又要怎样变简单呢？

首先拷打 " 灵光对话 "

灵光有三大基础功能：灵光对话、灵光开眼、灵光闪应用。

对话，是作为 AI 助⼿非常基础，但又很关键的功能。

我最近老在 b 站刷到恐龙科普视频，于是想到一个非常适合拷打灵光对话能力的问题：

霸王龙和迅猛龙的区别是什么？

灵光的反应速度不错，两秒钟后，开始输出，不到十秒钟 " 交卷 "。

对比过多家产品，灵光给出的答案有个特点：字数不多但总结能力很强。

在各种极繁的互联网信息中，这种⾼度提炼的能力我自己非常喜欢。

比如前面的问题中，把霸王龙比作重装坦克，迅猛龙比作特种部队这个总结非常巧妙，一下就把二者体型，咬合力，群居和独行的生活习性给高度概括了。

另外，灵光会主动穿插图片，图文并茂地给出回答。

我查了一下，这是灵光对话的特点之一，不仅能⽣成插图，把一些抽象复杂的知识化繁为简，直观呈现为图像或动画。

于是我继续让它给我解释霸王龙，并且以 3D 的形象展示，结果它既给出了形象，又科学还原了细节：

和市面上很多生成方式不同，灵光这种图文穿插的对话，特别适合快速研究、做科学启蒙等。

从技术层面看，灵光是首个实现了全代码生成的多模态内容输出，以代码为核心生成方式，实时构建结构化、个性化的可交互的答案。

这样，才能做到图文并茂，甚至还能生成 3D 模型、地图。

灵光开启了一种全新的信息交互方式，怪不得网友评价 " 杭州年初有 DeepSeek，年末有灵光 "。

我接着问灵光，我这周末想从北京出发，去虎跳峡徒步，请帮我规划一个三天两晚的行程，于是我得到了这个答案。

它给出的路线和行程安排，基本上已经不输高定旅游团的路书了，连带着图片和打卡点，并且连各种住宿，饮食细节都考虑在内。

甚至还列出了各种费用和穿着提醒。

只能说，它作为 AI 助⼿，它的规划能力，已经做到非常详尽的程度了。并且这些所有的内容，都是基于一句话指令，就能触发一整套行动，这一点非常重要。

灵光的 " 杀招 "：30 秒生成应用

除了对话，AI 还有什么生成方式？

我觉得灵光闪应用给了行业一个答案。

按照蚂蚁官方的说法，只需要 30 秒，通过灵光闪应用，用户就能⽣成一个可交互的应⽤。

基于我之前的经验，搭建一个 APP，首先要跟产品经理和设计同事开几天几夜的会，得到一个 APP 原型图，接着让建模同事渲染模型，再找前端后端同事搭网页框架，最后加上优化代码测试上线，前前后后可能得几十个人几个月时间。

虽然现在 AI Coding 很厉害，但大部分 AI Coding 模型，依旧对使用者有代码能力的要求。

而现在灵光闪应⽤，在 0 代码的前提下，30 秒就能手搓一个出来，我尝试了一下让它建一个太阳系的科普小应用。

创建完应用后，我发现它还能随时更改调整，并且提示我可以加入彗星特效，我果断答应。它不仅给你实现了代码，还免费给你上 UI 设计。

非常顺利，紧接着我又尝试了不同的小应用，比如设计一个解压游戏。

没过一小会，就手搓成功玩起来了。

不止如此，还能生成一个放各种星型烟花的应用，一个帮助打工人放松眼睛的应用，甚至是低脂饮食减肥闪应⽤，电子木鱼闪应⽤，以及翻译工具和故事书等闪应⽤。

当我开始玩上了灵光闪应用，我意识到，我对这个 APP 的开发程度，还不足百分之一。

之所以可玩性如此高，是因为灵光闪应用是对话式、0 代码的 AI Coding 应⽤，⽆需代码 IDE，也⽆需离开对话框进⾏编程任务，就能完成一个应用。

它的速度，对⽐其他低代码产品，快出了⼏个数量级。我测试了一下，生成一个应用的时间，基本能控制在 30 秒左右。

和市面上大部分小应用不同，灵光生成的应用，不只是静态的前端页面，而是可直接调用大模型等后端能力的轻量级应用。（雷峰网）

我试了一下，用灵光搭建了一个翻译小工具，不仅能真实使用的，还能实时输入实时翻译。如果给孩子搓一个一个故事书闪应用，它就能自己写故事自己朗读，完全替代了故事机。

这些应用具备完整的前后端逻辑，实际上是拓宽了可实现的场景边界，让灵光闪应用功能不仅能展示结果，更能实时与外部进行交互。

后期，很难想象大家会用灵光闪应用开发出什么应用，毕竟网友的脑洞有多大，也许灵光的开发者们根本想不到。

但灵光闪应⽤的出现，是一件很有意义的事，原先普通人跟专业开发者之间是有壁的，复杂的代码能力和建模能力难住了普通人，但在 AI 时代，普通人通过一些类似灵光这样的工具，也能⼿搓应用。

不仅满⾜普通⼈做开发的好奇⼼、创作欲、分享欲，让 " ⼈⼈都能成为产品经理 "。这种铲平了 AI Coding 的⻔槛，推动 AI 平权的尝试，非常有意义。

灵光开眼，打开了探索者的新世界

除了灵光对话和闪应用，还有一个功能：

灵光开眼

这个功能，在主页面底部最容易触达的位置，是灵光 APP 的一个想象力很大的功能。

我在使用过程中发现，它不止是手机里简单的扫一扫或者图片识别，而是一个内置的 "AGI 相机 "。

我打开灵光开眼，对着窗台随便举着拍摄，无意间它帮我解开了困惑已久的谜题，那就是窗台上同事养的水培植物到底是什么品种。

然后，我又举着手机在办公室里体验，有了不少意外发现，比如被同事种草很久的取暖神器的品牌型号，办公桌上手办小人的名字，甚至连实习生穿的大衣品牌都识别出来了。

总之，带给我一种感受，打开灵光开眼，对着现实世界中的任何物体、场景或文字时，就会有一些新的发现。

有时候它能科普某个植物，某段文字的来历，或者某个机械结构，路过一家店，拍个招牌就能问它历史、特色，有一种感受，它会主动去 " 读懂 " 你眼前所见的一切。

这种 " 拍摄即问，实时回答 " 的体验，让我觉得体验感非常流畅。

前面的灵光对话，必须要你主动去跟它沟通提问，而灵光开眼，就像是一个导游，一个老师，带着你主动去探索你看到的一切。

这种探索感，会带给用户一种全新的交互感受。它除了能解释这是什么，还能获取 " 为什么 "、" 怎么⽤ " 等等延展知识。

此外，面对学生或者学术研究者，这个功能还能够做到 " 快速研究 "，即使是冗长的文件、报告或学术文章，也能快速帮你整理出核心要点，把复杂的概念清晰明了地呈现给你。

除了 " 解释世间万物 " 外，灵光开眼还有另一个非常不错的体验：⾃由创作功能。

当打开灵光开眼对着某个场景，它除了能识别外，还能一个 " 创作 " 的按钮，点击之后，打开了新大陆。

我将镜头对着办公室的一个羊驼玩偶和一盆虎尾兰。

输入了一句指令 " 创造一个视频，让羊驼开始吃草 "，于是不到五秒钟，得到了一个视频。

⼀句话就能为静态照⽚注⼊鲜活⽣命⼒，这种图生文对于当下的大模型来说，也许不是很难的事情，但在灵光 APP 里不需要导入图片，输入咒语，门槛很低，加上自然顺滑的流畅感，让用户会非常爱用。

在这些充满脑洞的场景下，我们意识到，对 AI 的产品涌现形态，我们还有太多可能性。（雷峰网）

大洋彼岸，即将登场的谷歌下一代 AI 模型 Gemini 3.0 传出 5 秒搭一个网站，一句指令构建 Windows 系统，一键克隆 YouTube 等等充满想象力的玩法。灵光虽然性能上比不过谷歌 Gemini3.0，但是它们都在朝着同一个方向探索，探索生成的边界。灵光的不一样在于，它门槛几乎为零，这就让普通人也能极其容易的用上最新生产力。

每一个产品涌现的新应用，包括灵光 APP 每一个图文并茂的回答，每一次探索世界的灵光开眼，都让我们意识到，我们正走在创造更多 AI 产品可能性的路上。

就像人类对脑子的开发不足 1% 那样，我们对灵光 APP 里的开发不足百分之一，我们通过灵光实现我们的灵光也不足 1%。

在未来某个时刻，类似灵光这样的 AI 助手，将不再是存在于屏幕另一端的 " 工具 "，而是与你我并肩探索世界的 " 伙伴 "。

宙世代

一起剪

相关标签