36氪 05-26
红杉中国推出全新AI基准测试xbench
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

36 氪获悉,5 月 26 日,红杉中国宣布推出全新的 AI 基准测试 xbench,并发布论文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。这是首个由投资机构发起,联合国内外十余家高校和研究机构的数十位博士研究生,采用双轨评估体系和长青评估机制的 AI 基准测试。xbench 将在评估和推动 AI 系统能力提升上限与技术边界的同时,重点量化 AI 系统在真实场景的效用价值,并长期捕捉 Agent 产品的关键突破。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 红杉 研究生
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论