经济观察报 05-13
零一万物李开复:用最少的芯片、最低的成本去训练“能力所及”的模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

经济观察网 记者 钱玉娟 5 月 13 日,创新工场董事长兼 CEO 李开复带队孵化的 AI 公司零一万物,正式发布了千亿参数规模的闭源模型 Yi-Large。这是零一万物发布的首个闭源模型,也是首个千亿参数规模模型。

这次 Yi-Large 发布,许久未露面的李开复还通过个人抖音账号对发布全程进行了直播。他介绍,在斯坦福评测机构 AlpacaEval 2.0 官方认证的最新模型排行榜上,Yi-Large 模型的英语能力主要指标 LC Win Rate(控制回复的长度)排到了世界第二,仅次于美国人工智能研究公司 OpenAI 旗下最新大模型 ChatGPT-4 Turbo。

在各家大模型进入能力力求对标 ChatGPT-4 的阶段,零一万物在 Yi-Large 模型能力评测和展示环节,也表示在通用能力、代码生成、数学推理、指令遵循等多方面,模型指标超越了 ChatGPT-4、Google Gemini 1.5 等同级模型。

除了发布闭源模型 Yi-Large,李开复还宣布零一万物早先发布的 Yi-34B、Yi-9B 等中小尺寸开源模型,版本可升级到 Yi-1.5 系列。借此机会,零一万物公开了开源、闭源双轨大模型的战略布局。

2023 年零一万物创立,以开源模式进入 AI 领域。2023 年 11 月,零一万物首发 Yi 系列开源模型,仅一个月后,Yi-34B 版本模型成为国内唯一一个被英伟达 AI Playground(AI 游乐场,一个提供预训练模型和资源的平台)收录的大模型。

Yi 系列开源模型发布后,零一万物收到了来自全球开发者的反馈," 从学习、导航、销售、API(应用程序编程接口)的应用到商业写作,都已经开始有早期用户 "。李开复认为模型开源会让全球每个用户受益,他甚至觉得,学生、创业者、老师、科研人员、公益组织都需要用大模型,但 " 无论用 ChatGPT-4 还是 Yi-Large,(他们)都会嫌太大、太贵 "。

与 OpenAI 这一超级独角兽在巨额融资后可以用超级多的 GPU 展开模型训练不同," 我们是务实的 AGI(通用人工智能)信仰者 ",李开复说,零一万物走出了一条适合自己的路,就是用最少的芯片、最低的成本去训练 " 能力所及 " 的模型。

谈及零一万物的发展方向,李开复称," 我们的精力不会放在行业预测,也不会用大力出奇迹的唯一思维,(去)追求能不能用一百亿美金、一千亿美金(预测 AGI 的燃点)",他认为与零一万物相关度更高的是 "AI 普惠点 ",他希望团队成为一个 " 点燃者 ",帮助开发者通过 API 和 Yi 系列模型,在电商、社交、娱乐等领域打造出 AI 时代的淘宝、微信、抖音等。

" 现在是分秒必争。" 李开复看到国际大厂都在不断迭代进步,零一万物的步伐也在加快,在推出 Yi-Large 大模型的同时,零一万物内部已经启动了下一代模型 Yi-XLarge 的相关训练。

李开复称,目前 " 不是可以做一个模型,然后就休兵半年、一年的时间 ",团队正朝着美国前沿大模型去探索模型技术的进步。李开复也见证着中国公司在一个新的环境里快速并野蛮生长," 当然会有一家又一家(公司)慢慢地转型甚至退场 ",但他随后说,眼下中国模型市场还在成长中,不要低估中国创业者的生命力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

零一万物 李开复 开源 ai 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论