文 | 硅谷 101
上世纪末,谷歌的搜索引擎永远地改变了人们获取信息的方式。25 年后,这家如今的科技巨头大胆宣称:未来的搜索将是一个完全由 AI 驱动的世界。
今年 5 月,谷歌在其最大的开发者盛会 Google I/O 上推出了 AI 重塑的搜索引擎,用户可以向 AI 提出复杂的问题,甚至加以追问,而 AI 会进行相应的搜索并回答你的提问。
这不仅是巨头的一场自我革命,更是对 Perplexity 和 OpenAI 等 AI 新贵的强力回应。同时发布会还推出了 Gemini 2.5 Pro 模型、XR 眼镜等一连串重磅更新,其实谷歌在技术上的实力毋庸置疑,但其产品化能力却一直备受质疑。
我们在 I/O 现场的明显感受是:如今的 AI 之争不再是拼谁的模型跑分高,而是拼谁能先把 AI 真正用起来。生成式 AI 的热潮正在褪去,AI Agent 的时代已经开始了。
但在这些技术突破之外,大家更关心的问题是:谷歌,还是那个能够颠覆行业的谷歌吗?
这家公司有技术、有人才、也有钱,但近几年来推出的产品好像总差点意思:虽然 Transformer 架构诞生于谷歌,但从中受益最多的却是 OpenAI;如 NotebookLM 这样的产品,尽管初看惊艳,但似乎在商业应用上有些 " 雷声大雨点小 "。
本篇文章我们就借着这次 I/O 的机会聊聊,现在 AI 产品的竞争,到底是在拼什么?
01 Google I/O 更新内容
Chapter 1.1 AI Mode 重塑搜索
从去年 I/O 开始,谷歌加入了名为 AI Overview 的 AI 生成摘要功能。
虽然 AI Overview 曾因为 " 建议在披萨上涂胶水 " 等回答被用户吐槽,但谷歌表示,这项功能的月活跃用户已经超过 15 亿。它现在也将从实验室毕业,推广至 200 多个国家和地区、支持 40 多种语言。
本次更新的 AI mode 则是 AI Overview 功能的一次升级,是谷歌最核心的搜索功能结合了 Gemini 2.5 模型后的产品:谷歌不再是简单地提供 AI 总结,而是可以回答复杂、多步骤的问题,未来还会支持更复杂的体育与金融数据问题,甚至调用用户的个人数据生成个性化的答案。
AI Mode 也加入了一个叫做 Deep Search 的功能,与 OpenAI 的深度搜索对标,在收到用户的问题后生成一份带引用来源的完整报告,能节省好几个小时的研究时间。
谷歌官方建议,Deep Search 适合于购物等容易犯选择恐惧症的场景。AI 接管购物流程的例子比比皆是,AI 试穿就是一个很有趣的例子:AI Mode 下,用户上传自己的照片,AI 就能模拟你穿上某件衣服的样子。谷歌说这个 " 试穿 " 功能可以识别不同布料、弹性和 3D 形状,现在已经在 Labs 中上线。
几个月后,谷歌还会推出一个 " 自动下单 " 工具:当商品降到用户设定的价格后,AI Agent 可以主动帮你下单(当然,最终仍需用户点击确认)。未来还会有 "Search Live" 功能,能直接结合手机的摄像头,让 AI 根据用户眼前看到的东西实时对话、提供信息。
从去年的 AI Overview 到今年的 AI Mode,再加上各项套用多模态模型,基于 Agent 的功能,万变不离其宗的都是谷歌核心的搜索技术,也说明了一点:谷歌意识到,它必须重新定义搜索,才能在 AI 时代保住它的地位。
过去二十年," 搜索等于谷歌 ",这是一个毋庸置疑的事实。但进入生成式 AI 时代后,一切开始动摇。
2022 年 ChatGPT 刚上线的时候,谷歌立刻拉响红色警报,意识到 AI 正在威胁它的舒适区。但那时候,谷歌没怎么动,毕竟它不是初创公司,手上捧着的是年营收超过 2000 亿美元的搜索业务,占了全公司一半以上的收入。你很难指望这样一个体量的巨头,敢拿出 " 会幻觉 " 的 AI,直接替代稳妥靠谱的搜索引擎。
于是,谷歌选择了稳一点、慢一点。但三年过去,它却不得不面对一个现实:搜索这块最核心的地盘,真的开始被类似 Perplexity 和 OpenAI 这样的 AI 初创公司抢走了。
刘沁东(Bruce Liu)
美国济容投资 CEO 兼首席投资官:
随着 AI、GPT 等新的工具和流量入口的出现,我觉得对 Google、尤其是对华尔街最大的困扰是:Google 还能不能保持它在搜索上面的优势地位?丢市场份额是一定的,但是丢到什么程度、要付出的代价还不确定。
今年五月的一起反垄断案的庭审中,苹果高管 Eddy Cue 承认:谷歌的搜索流量在过去 22 年里首次出现下滑,因为越来越多用户开始用 AI 搜索替代传统搜索。这对谷歌的打击,尤其在资本市场上是巨大的,我们会在最后一章展开分析。
谷歌在本次 I/O 的发布中,便是在用这一整套 AI 搜索系统守住它的护城河——这不仅是技术的更新,更是用户习惯的重塑。但是,这不可避免的也会涉及知识产权的问题以及和内容出版商之间的漫长博弈;而这也将是我们接下来关注的重点。
Chapter 1.2 Gemini 能力提升
对于关注 I/O 的开发者来说,搜索以外最让人兴奋的更新应该是 Gemini 2.5 的各大新功能。
谷歌 DeepMind 的 CEO Demis Hassabis 在展示 Gemini 2.5 的时候,重点强调了它能深度思考的能力,这个过程被称为 "Deep Think"。Deep Think 采用了所谓的 " 并行推理技术 ",允许模型在生成回答之前,探索多个可能的解答路径,从而提高答案的准确性。
Sergey Brin
Alphabet Inc. 联合创始人兼董事:
如果 AI 能够在提供方案之前先深度思考,显然会更加强大,而我们现在看到的只是 AI 能力的冰山一角。
这些能深度思考的模型出现还不到一年时间,尤其是 AI 在其思考过程中还可以使用许多工具,甚至利用其他 AI 来改善最终输出结果。因此,我认为这将是一个非常强大的范式。
谷歌这次还给开发者带来了两个新的订阅服务:月费 20 美元的 Google AI Pro 和月费高达 250 美元的 Google AI Ultra,直接对标 ChatGPT Pro 和 Claude Max(两个服务各为 200 美元 / 月)。
Ultra 用户可以使用谷歌最新的图像模型 Imagen 4 和视频生成模型 Veo 3,还能抢先体验最新 AI 能力,比如自动生成带音效的视频画面。
Shaun Wei
Hey Revia 创始人
ex-Google Assistant:
无论是 OpenAI 的 Sora,还是文生图(Text To Image)、文生音频(Text To Audio)等各种各样的尝试,大家都想达到一个目标:把大脑里面想象的东西变成电影的画面。我觉得在 Google 的发布会上,我看到了真正把想法变成视频的演示。
对于大部分用户而言,Gemini Live 的摄像头和屏幕共享功能也已经在移动设备上开放了。用户可以边走路边拍摄周围街景,直接问 Gemini:" 这栋建筑是谁设计的?" 或 " 这是什么风格?",而 AI 会基于手机实时画面回答问题,几乎没有延迟。
该功能背后依托的是谷歌的多模态 AI 系统 Project Astra,它能理解图像、语音、文字,并与你进行自然对话。不久之后,Gemini Live 还将与各项谷歌的效率产品整合。用户可以边对话,边创建日程、生成路线或安排待办事项。
而 Project Astra 这个多模态系统,其实也寄托了谷歌在 AI 上最大的野心。它本身并不是一个面向消费者的产品,DeepMind 的 Greg Wayne 将它看作一辆 " 概念车 ",展示谷歌对未来 AI 助手的全部想象。它背后的目标只有一个:打造一个真正通用、懂你、会帮你做事的 AI 助手。
在 I/O 上,谷歌宣称 Astra 不再只是被动等用户提问,而是自己判断什么时候说话、说什么话。比如你正在写作业,它能看出你哪里算错了,直接提醒你;又比如你在间歇性断食,它甚至会在你打破禁食时间前问,你确定你现在应该吃东西吗?Hassabis 将 Astra 称为读空气的 AI(reading the room),认为这才是真正的助理。
Project Astra 的很多功能,未来会逐步下放到 Gemini 和其他谷歌产品中。但实际上已经有一个应用场景呼之欲出了,这就是眼镜。
Chapter 1.3 XR 眼镜
今年 I/O 展示的硬件更新并不多,但眼镜可以说是大家关注的主角。
在I/O 上,谷歌展示了和三星、Gentle Monster、Warby Parker 等品牌合作开发的一款样机。这幅 XR 眼镜叫做 Android XR,并且搭载了 Gemini AI。演示上展示的几个功能包括了实时翻译、导航辅助、视觉识别等等。
我们也在现场体验了这款 XR 眼镜。眼镜本身佩戴感很好,与普通眼镜重量几乎无差。戴上眼镜后,除了发布会视频中演示的与 Gemini 交流、播放音乐之外,还可以使用 Gemini 鉴赏油画、根据风景图片分辨并制定相应地点的旅行计划等。
虽然并没有体验到发布会演示中用 XR 眼镜看地图和实时翻译的功能,不过总体而言,这个体验很新奇,也很符合大众对 XR 眼镜的期待。
当然,谷歌这次一口气发布了十几项更新,聚焦在 AI 及各类开发工具。这就比如说可以基于浏览器执行复杂任务的多模态 AI agent Project Mariner。
作为做中英文内容的创作者,我们最感兴趣的功能之一,其实就是跨语言的实时转换。如果一个 AI 助手能在我们录制播客或剪辑视频时,直接把中英文内容自然地同步处理并转写,那将极大提升我们的效率。
以上是粗略的体验分享,这也体现了谷歌这样的巨头在 AI 时代的独特优势:行业领先的模型、全球搜索流量,和强大的底层技术。用谷歌自己的话说,这种规模(scaling)是初创公司很难赶上的。
接下来聊聊开发者希望从今年的 AI 模型更新中看到的新能力。
02 开发者想看到什么?
Kimi Kong
Energent.ai 联合创始人
ex-DeepMind:
Google I/O 让我印象最深的是 Google 对于它旗下模型和产品的横向广度与纵向深度的一个整合。这让我觉得,Google 对于未来已经进行了全面布局。
Kimi Kong 曾在谷歌 DeepMind 工作,参与过大语言模型评测和 AI Agent 两个关键项目。他认为,本次 Google I/O 的最大亮点之一,是谷歌展示的 " 大一统模型 " 的雏形。
从广度上来看,只需要一个 Gemini 模型,就可以执行问答、代码生成、多轮对话、图像识别、视频理解等多种任务,涵盖了开发者在不同模态下的主要应用场景。从深度上来说,谷歌不仅提供模型能力本身,还进一步展现了这些能力如何被落地到真实产品中,给开发者留下了极大的想象空间。
比如,在搜索这个纵向应用中,AI 不仅能在云端帮助用户生成结构化答案,还可以部署到可穿戴设备。就像我们在体验 XR 眼镜的时候,只要是视野内看得到的问题,就可以向 Gemini 提问,而 Gemini 会帮我我们进行搜索。
然而,在众多更新里,其实很难看出最后哪些能够在产品化上实现成功。
Google 的产品一直是它的弱项,大家都知道这点。所以我觉得,Google 这次就是要围绕它强劲的 Gemin 模型来打造自己的生态。
Shaun Wei 曾在谷歌负责语音助手项目。他告诉我们,从外部来看,谷歌目前的策略就是一次性发布大量产品。一旦发现哪个产品真正跑的出来,就可以再加大投入。
比如,2023 年 7 月发布的 NotebookLM,一开始只是一个相对小的项目,但面向公众开放后却收获了大量好评,于是谷歌才开始倾斜资源。
而谷歌自己强大的技术是毋庸置疑的,主要有几方面优势:
1. 硬件生态
2. 自己的云服务 Google Cloud 以及数据中心
3. 海量可以用于训练 AI 的数据
4. 强大的算法团队
Google 在底层的时候就已经比大部分公司有优势了,基本上没有多少公司能做这个事情。所以谷歌如果通过一年的努力变成整个模型的第一,我不会觉得奇怪。
在谷歌提供了全栈式服务之后,那些做 AI Agent 的初创公司还做得下去吗?
Shaun Wei
对于 To C 的公司确实是影响会非常的大,因为大公司的模型能力很大,而且大部分巨头最先考虑的就是面向 C 端用户来扩大能力。其实很多简单的功能,比如打电话,AI Agent 只需调用一个工具就能做的事情,它开发的门槛是越来越低的。如果你解决的垂直赛道里边,它的工具量特别的少,或者它对于整个商业、工作流的逻辑特别少的话,确实有可能会直接被大公司取代。
百家齐放的状态也给初创企业带来了机会:正因为不同模型各有所长,才有了初创企业把不同模型整合、完成非常复杂的任务,并捕捉这个垂直且深度市场的机会。
在聊完谷歌在技术层的突破后,我们再来看看,华尔街现在怎么看待谷歌这家公司的。
03 华尔街想看到什么?
Google I/O 首日,谷歌的股价跌了 1.5%。5 月 21 日(I/O 的第二天),谷歌的股价开盘上涨 5 个点。各大银行分析师都指出,谷歌的 AI 资产被低估了。I/O 期间的发力,很可能是谷歌成功打赢这场 AI 竞争的核心。
美国济容投资 CEO 兼首席投资官:
追重要的是谷歌的全栈式服务(Full Stack),真正地利用好了谷歌所有 AI 能力,包括它现有的庞大的用户群、它强大的分发能力(distribution)。把 AI 的能力完全地嵌套进来,变得特别的清晰。
正如前文反复提及的,这就是谷歌作为一家科技巨头难以被超越的地方。
在 I/O 之前,资本市场对谷歌一直有一个疑问:为什么大部分突破性的技术都发源于谷歌,但从中收益、将这些研究产品化的却是别人?可以说谷歌是起了个大早,赶了个晚集。谷歌现在终于在 I/O 期间初步证明了自己产品化的能力。
然而,这并没有解决谷歌的核心问题:AI 搜索可行,但却不一定能够盈利。
过去谷歌之所以可以通过搜索赚的盆满钵满,主要是因为广告:用户的每一次搜索,其实背后都有一场无声的竞价战。广告商会通过关键词付款,所以那些关于购物和比价的搜索,都是谷歌源源不断的印钞机。但是在 AI 搜索模式下,还仍然没有一个投放广告的方式。
我试用了谷歌的 AI mode,当我问它 lululemon 新出的裙子时,看不到任何能够放广告的地方,它也没有想到插广告的办法,这也是业界的争论点。我觉得,什么时候大家找到了在 AI 对话里面怎么合理地去放广告、收广告,新的机制被搭建起来之后,这个问题才算解决。
但除了 I/O 期间的股价变化之外,谷歌今年的股价其实一直没有大幅度的突破,自二月达到 52 周最高点后就持续回调。同时,特朗普 4 月初宣布全球关税之后,依赖于出海电商广告业务的谷歌和 Meta 都受到很大影响,所以也在那段时间出现了下跌。但总体来说,五月之前股价的变化和谷歌公司本身的运营状况关系并不大。
5 月 7 日,谷歌的股价却迎来一次大幅下跌,最大的原因就是之前提到的苹果高管 Eddy Cue 的发言,认为谷歌的搜索业务正在受到 AI 威胁。但其实这里还有一个更大的背景,就是谷歌正在面临两项由美国政府发起的重大反垄断诉讼。
第一起诉讼指控谷歌在搜索引擎市场中滥用其主导地位,利用与设备制造商和浏览器的默认设置协议,阻碍竞争对手的发展。第二起诉讼则聚焦于谷歌在数字广告领域的行为,指控其通过收购和整合广告技术平台,非法维持其在广告市场的垄断地位。
这些诉讼不仅可能导致谷歌被迫改变其商业模式,甚至面临拆分公司的风险。
当然,这并不代表谷歌立刻就要被分拆,谷歌在这方面的诉讼非常有经验,也花了很多钱在律所、法务团队上。想要提起诉讼并真正拆分谷歌,会是一个非常耗时间的过程,即使需要 5 年、10 年也不奇怪。但是,有了这么多年打官司的经验,控方也越来越理解谷歌在广告科技(advertising tech)市场上的垄断到底是怎么实现的,这对 Google 造成的风险也确实是越来越大的。
但是我认为,市场还没有真正定价(price in)这点,如果这点变得越来越清晰,谷歌是有风险被拆分的,到时候会有新一轮的定价。
04 巨头依然有难以比拟的优势
不管是从技术还是商业角度来看这次谷歌 I/O 的发布会,大家的共识都是:巨头确实具备难以比拟的优势。在此之前,谷歌似乎没有抓住这个竞争优势,所以这次的发布会,很大程度上给大众吃了一剂定心丸。
但就像我们访谈嘉宾分析的那样,谷歌这个搜索巨头可能确实用 AI" 革了自己的命 ",但这家公司真的还能保住自己的霸主地位吗?对这个问题,它可能很难给出回答。
就像谷歌很久没路面的谷歌联合创始人 Sergey Brin 说的那样:由于 AI 的出现,我们很难想象十年后的互联网,甚至十年后的人类世界。
以上就是硅谷 101 对 Google I/O 以及谷歌自我革命的梳理,也欢迎大家留言你的想法与感受。
登录后才可以发布评论哦
打开小程序可以发布评论哦