驱动之家 昨天
AI学会“睡眠”!Claude记忆优化后任务完成率飙升6倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 5 月 7 日消息,据媒体报道,在旧金山举办的开发者大会上,人工智能公司 Anthropic 宣布为旗下智能体平台 Claude 推出一项突破性功能—— Dreaming。

该技术允许 AI 在执行任务间隙进入类似睡眠的状态,通过模拟人类快速眼动(REM)睡眠机制,自动整理历史会话数据、优化记忆库并挖掘潜在规律,从而在 " 醒来 " 后显著提升性能。

传统 AI 代理处理复杂任务时,会将信息以碎片化方式存储于记忆库。随着会话次数增加,记忆库中逐渐积累重复条目、过时数据和矛盾信息,而 AI 缺乏全局视角,难以自主识别这些问题。

Dreaming 功能通过定时运行的异步任务,同时读取现有记忆库及最多 100 个历史会话的完整记录,生成经过优化的全新记忆库。该过程包含三个核心步骤:合并重复数据、更新过时条目、提炼宏观规律,其运作原理与人类大脑在 REM 阶段将短期记忆整合为长期记忆的过程高度相似。

为确保系统安全,Anthropic 设计了严格的控制机制。Dreaming 生成的记忆库不会直接覆盖原始数据,开发者可先审查优化结果,再决定是否应用。

该功能还支持实时监控:开发者通过订阅会话事件流,可观察 AI 处理记忆的具体过程,并在发现问题时随时终止任务。借助自定义指令字段,用户可引导 AI 聚焦特定主题进行记忆整理,实现多维度优化。

针对 AI 输出质量不稳定的问题,平台同步推出 Outcomes 自动评分系统。开发者可制定包含成功标准的评分规则,系统会分配独立评估器对 AI 输出进行打分。当检测到缺陷时,评估器将精准定位问题并指示 AI 重新优化,直至满足标准。

内部测试显示,该功能使任务成功率提升最高达 10 个百分点。在文档生成场景中,docx 格式任务成功率提高 8.4%,pptx 格式提高 10.1%,对品牌调性匹配等主观质量评估同样有效。

为应对更复杂的任务挑战,平台引入了多智能体编排系统。当单个代理无法完成任务时,主智能体可将任务拆解为多个子任务,分配给具备不同专业能力的子智能体并行处理。

各子智能体基于共享文件系统协作,成果汇总至主智能体的全局上下文。开发者可在控制台追溯每个步骤的决策依据,实现全流程透明化管理。

在月球采矿无人机着陆模拟实验中,该系统协调地质探测与导航两个子智能体,将安全评分从 67% 成功提升至 100%。

法律科技公司 Harvey 的实践验证了这套技术组合的价值。在应用 Dreaming 功能后,其任务完成率增长约 6 倍。

此外,Anthropic 宣布与 SpaceX 达成战略合作,租赁位于得克萨斯州的 Colossus 1 数据中心全部算力资源,包含 22 万张 GPU。这笔交易为托管智能体平台提供了强大算力支撑,满足 Dreaming 处理海量数据、多智能体并行运算以及 Outcomes 系统反复迭代的需求。

作为直接用户福利,Claude Code 的使用时长限额即时翻倍,Pro/MAX 版本高峰时段访问限制大幅放宽,Opus API 调用速率也获得显著提升。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 无人机 规律 旧金山
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论