通义实验室推出通用智能体评测基准PawBench

钛媒体快报 19小时前

通义实验室推出通用智能体评测基准 PawBench

2026.06.05 22:35

钛媒体 App 6 月 5 日消息，通义实验室推出评测基准 PawBench，v1.0 版本已开源。它面向个人助理与通用智能体场景，将底座模型与运行框架（Harness）纳入同一评测体系。据介绍，PawBench 不是单纯做一个模型排行榜，而是把 " 模型、Harness、任务 " 三者放在一起做交叉评测。（广角观察）

本文内容仅供参考，不构成投资建议，请谨慎对待。

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

宙世代

一起剪

相关标签