谷歌预言：五年内人类将告别直接操作数据库

在上周于伦敦举行的谷歌云峰会上，谷歌云数据库工程副总裁 Sailesh Krishnamurthy 与 Agentic Data Cloud 产品执行主管 Yasmeen Ahmad 描绘了一幅由 " 代理式 AI"（Agentic AI）主导的数据未来图景。

Ahmad 明确表示，谷歌正将代理置于核心位置。她预测，在未来三到五年内，人类将不再直接操作数据平台，转而负责编排代理，由代理执行具体工作。这一转变基于 " 意图驱动工程 " 理念：用户只需定义目标或结果，模型将自行拆解步骤、并行处理并应对复杂性，承担繁琐的低层数据整理工作。

从精确查询到 " 模糊 " 检索

Krishnamurthy 指出，AI 驱动的变革正在重塑数据检索逻辑。传统开发者习惯通过 SQL 获取精确结果，但在 AI 原生基础设施中，重点转向获取 " 最佳结果 "。这意味着系统需处理非确定性且计算成本高昂的 " 模糊查询 "，结合向量索引、文本索引和图技术，融合结构化与非结构化数据。

这并非意味着精确 SQL 的消亡。Krishnamurthy 解释，自然语言提出的模糊问题可能会在后台生成精确的 SQL 查询。为确保 AI 生成结果的可靠性，企业必须维护一套 " 评估集 "（evals），即一组代表性测试问题及其正确查询答案，通过不断迭代蓝图和上下文片段，直至评估集达到理想运行状态。

目前，谷歌已在 Spanner、AlloyDB 和 BigQuery 中集成 AI 功能，如 AI.IF 函数。该函数利用 Gemini LLM 评估自然语言条件，但存在效率瓶颈。为此，谷歌引入了 " 代理模型 " 概念——一种在数据库中实时训练的微型模型。论文数据显示，代理模型可替代部分 LLM 调用，使令牌消耗减少约 400 倍，延迟降低 30 至 100 倍。

对话式分析取代传统仪表板

Ahmad 认为，随着模型能力的提升，传统的商业智能仪表板将被 " 面向业务用户的对话式分析 " 所取代。仪表板仅能服务于可预测的问题，而对话式分析能处理更复杂的业务场景。她指出，通过改进上下文（如来自 " 知识目录 " 的信息），可有效缓解幻觉和提示词注入问题。此前因缺乏上下文导致的高错误率已得到显著改善，部分客户在使用对话式分析时准确率已超过 90%。

尽管准确率大幅提升，但对于重度依赖 AI 的企业而言，剩余的错误率仍可能带来交易被拒等风险。此外，将 AI 注入每次交互意味着在基础云资源之外，还需支付额外的令牌费用。虽然生产力提升可能抵消部分成本，但随着使用门槛降低，用量激增带来的开销不容忽视。

AI 推动数据基础设施爆发式增长

Krishnamurthy 透露，AI 正在显著推动数据存储和令牌使用的增长。以 Anthropic 为例，其依赖 BigTable 存储所有提示词信息及其他未公开工作负载。

他分享了两个关键指标：谷歌分布式数据库 Spanner 的峰值查询量已从一年前的每秒 50 亿次增至目前的 75 亿次，存储数据量约为 23 艾字节（EB）；BigTable 的情况类似，峰值查询约为每秒 70 亿次，数据量达两位数艾字节级别。

Krishnamurthy 观察到，模型发起的查询模式正在改变。不同于传统用户请求通常对应单个查询，一个模型任务可能会并发发送五个不同的查询以尝试不同方法。这种多查询模式进一步加剧了对底层数据基础设施的需求。

【星途科讯图文丨略略首发于 ZAKER 科技，转载请注明出处】

宙世代

一起剪

相关标签