星途科讯 2小时前
谷歌预言:五年内人类将告别直接操作数据库
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在上周于伦敦举行的谷歌云峰会上,谷歌云数据库工程副总裁 Sailesh Krishnamurthy 与 Agentic Data Cloud 产品执行主管 Yasmeen Ahmad 描绘了一幅由 " 代理式 AI"(Agentic AI)主导的数据未来图景。

Ahmad 明确表示,谷歌正将代理置于核心位置。她预测,在未来三到五年内,人类将不再直接操作数据平台,转而负责编排代理,由代理执行具体工作。这一转变基于 " 意图驱动工程 " 理念:用户只需定义目标或结果,模型将自行拆解步骤、并行处理并应对复杂性,承担繁琐的低层数据整理工作。

从精确查询到 " 模糊 " 检索

Krishnamurthy 指出,AI 驱动的变革正在重塑数据检索逻辑。传统开发者习惯通过 SQL 获取精确结果,但在 AI 原生基础设施中,重点转向获取 " 最佳结果 "。这意味着系统需处理非确定性且计算成本高昂的 " 模糊查询 ",结合向量索引、文本索引和图技术,融合结构化与非结构化数据。

这并非意味着精确 SQL 的消亡。Krishnamurthy 解释,自然语言提出的模糊问题可能会在后台生成精确的 SQL 查询。为确保 AI 生成结果的可靠性,企业必须维护一套 " 评估集 "(evals),即一组代表性测试问题及其正确查询答案,通过不断迭代蓝图和上下文片段,直至评估集达到理想运行状态。

目前,谷歌已在 Spanner、AlloyDB 和 BigQuery 中集成 AI 功能,如 AI.IF 函数。该函数利用 Gemini LLM 评估自然语言条件,但存在效率瓶颈。为此,谷歌引入了 " 代理模型 " 概念——一种在数据库中实时训练的微型模型。论文数据显示,代理模型可替代部分 LLM 调用,使令牌消耗减少约 400 倍,延迟降低 30 至 100 倍。

对话式分析取代传统仪表板

Ahmad 认为,随着模型能力的提升,传统的商业智能仪表板将被 " 面向业务用户的对话式分析 " 所取代。仪表板仅能服务于可预测的问题,而对话式分析能处理更复杂的业务场景。她指出,通过改进上下文(如来自 " 知识目录 " 的信息),可有效缓解幻觉和提示词注入问题。此前因缺乏上下文导致的高错误率已得到显著改善,部分客户在使用对话式分析时准确率已超过 90%。

尽管准确率大幅提升,但对于重度依赖 AI 的企业而言,剩余的错误率仍可能带来交易被拒等风险。此外,将 AI 注入每次交互意味着在基础云资源之外,还需支付额外的令牌费用。虽然生产力提升可能抵消部分成本,但随着使用门槛降低,用量激增带来的开销不容忽视。

AI 推动数据基础设施爆发式增长

Krishnamurthy 透露,AI 正在显著推动数据存储和令牌使用的增长。以 Anthropic 为例,其依赖 BigTable 存储所有提示词信息及其他未公开工作负载。

他分享了两个关键指标:谷歌分布式数据库 Spanner 的峰值查询量已从一年前的每秒 50 亿次增至目前的 75 亿次,存储数据量约为 23 艾字节(EB);BigTable 的情况类似,峰值查询约为每秒 70 亿次,数据量达两位数艾字节级别。

Krishnamurthy 观察到,模型发起的查询模式正在改变。不同于传统用户请求通常对应单个查询,一个模型任务可能会并发发送五个不同的查询以尝试不同方法。这种多查询模式进一步加剧了对底层数据基础设施的需求。

【星途科讯 图文丨略略 首发于 ZAKER 科技,转载请注明出处】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 ai 数据库 谷歌云 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论