01
去年开始的轰轰烈烈的 AI 热潮随着整个行业的进展缓慢,似乎逐渐退潮。
然而现实是,AI 浪潮只是从观众眼中淡去,研究的进程仍在推进。
继今年五月零一万物发布千亿参数模型 Yi-Large 后,近日,零一万物正式对外发布最新旗舰模型 Yi-Lightning。
一经出世,便饱受业界关注。
国际权威盲测榜单 LMSYS 显示,目前 Yi-Lightning 已超越 GPT-4o。
这也意味着,仅仅花费了五个月,零一万物就已追上 OpenAI 的顶级模型。
实则,早在今年 6 月,零一万物创始人李开复博士在《格隆博士会客厅》的访谈中,已经对国产大模型进行过分析。
彼时他认为,中国大模型与美国顶级大模型之间的差距已经从之前的 7 至 10 年迅速缩短至仅有六个月。
而这次,Yi-Lightning 超越了 OpenAI 在 2024 年 5 月推出的 GPT4o,也就是说,中美大模型的差距进一步被缩短到了 5 个月。
仔细来看,在分类榜上,Yi-Lightning 各项能力都名列前茅。
在中文能力上,Yi-Lightning 跃居并列第二,和 o1-mini 相差无几。数学能力,Yi-Lightning 和 Gemini-1.5-Pro-002 并列第 3,仅次于 o1-preview、o1-mini。
在代码、Hard Prompts、Longer Query 等能力上,Yi-Lightning 也都位列前五。
对比五个月前发布的 Yi-Large,Yi-Lightning 首包速度提升 1 倍,推理速度也提升了 4 成,可谓进步飞速。
在这次的发布会上,除了发布新模型,零一万物还首发了 AI 2.0 数字人方案并公布了零一万物在 B 端产品上的最新进展。
李开复称,零一万物最新旗舰模型 Yi-Lightning 的 API 价格已降至极低水平,每百万 token 仅收费 0.99 元。
早在今年 5 月,字节、百度、阿里云、腾讯、讯飞等大模型厂商纷纷大降价,曾经引起了不小的争议。
当时李开复在发布大模型系统时曾表示,其认为大模型之间搞类似于 ofo 的流血打法是双输的策略。
这次发布会再次谈及之前的 " 价格战 ",李开复仍旧表示不认可,他认为,当时有很多性能很差的模型价格都降得非常低,甚至是免费,但让接入的企业和个人体验起来都不达预期。
而针对此次零一万物的大模型降价和外界关于零一万物亏钱拉客户的质疑,李开复称,零一万物大模型的真实成本比 0.99 元低,还有利润空间。
此前,OpenAI 官宣获得 66 亿美元融资,估值突破 1500 亿美元。随后,媒体报道称,经过对 OpenAI 财务数据的分析,推测其会在 2029 年实现盈利。
但在此之前,OpenAI 仍会保持较为严重的亏损,预测 2026 年亏损幅度将达到 140 亿美元。
作为 AI 领域绝对的龙头,OpenAI 尚且如此,其他企业或许更加艰难,特别是国产大模型初创企业。
月之暗面、百川智能、智谱 AI、Minimax、零一万物、阶跃星辰,这 6 家中国大模型初创企业被称为国内的 "AI 六小虎 "。
然而月初,有媒体报道,"AI 六小虎 " 中有两家已经逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向 AI 应用,而零一万物就是其中一家。
而李开复回应称,尽管预训练既是技术活也费钱,但目前 "AI 六小虎 " 做预训练仍不成问题。
同时他还提到剩下的 5 家公司,他表示 " 这 6 家公司融资额度都是够的,我们做预训练 production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的 6 家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。"
这对于国内的大模型公司或许是一个好的迹象,但国产大模型仍在寻找方向。
02
刚刚过去的 9 月,OpenAI 发布了 OpenAI o1 系列模型,被业界称为是 AGI 一大新进程。
李开复认为,OpenAI 内部其实攒了很多好东西,除了 OpenAI o1 以外,OpenAI 领先行业足够多,但会等待合适的节点再释放。
放眼现在的 AI 行业,早已度过了最开始的狂热阶段,但不管是国外还是国内的 AI 公司,都在暗流中继续前进和竞争。
目前,国内的大模型主要分为两类,一类是基础通用大模型,比如文心一言、通义千问等等,一类则是专注各类细分赛道的大模型,金山的政务大模型,一些公司的医疗、金融等等。
工业和信息化部近日发布的最新数据显示,目前我国完成备案并上线为公众提供服务的生成式人工智能服务大模型已经近 200 个,注册用户超过 6 亿,产业相关企业数量超过了 4500 家。
如果单从数字上看,国产大模型的技术成长可谓相当飞速。
且 SuperCLUE 的评测结果显示,国内绝大部分闭源模型已超过 GPT-3.5Turbo,在技术上和国外大模型的差距不断缩小。
然而,对于国产大模型,不少人仍旧心有疑虑,因为这样的对比对于 AI 的商业化来说并无意义,更为重要的,是如何对 AI 进行应用。
尽管各家大厂、垂类企业以及初创公司都在铆足了劲钻研技术,较量日活,不断追求更大的数据量、更强的计算能力以及更复杂的模型训练,但国内市场仍旧缺乏能够承载 AI 的杀手级应用。
也是因此,在国内大模型技术不断提升的同时,普通人对于 AI 技术力提升的感知却逐渐减弱,市场对于 AI 的热情也逐渐削减。
绝大多数人难以体会到 95% 到 99% 这一阶段的技术提升,唯一能够让人感受到 AI 技术提升的是,AI 在逐渐被运用到什么日常领域之上,究竟带来了怎样的生产力提升。
因此我们可以看到,尽管在不少垂类行业上,AI 愈臻完美,应用也越来越普遍,但反而是在高日活、高个性化的 APP 上,AI 难以施展拳脚。
例如,尽管抖音的豆包等一系列 AI 已经较为成熟,但是对于抖音的生态本身,并没有带来更大的改变。
因为抖音已经对于用户画像进行高度区分,应用中需要的是超高的定制化和精准化需求,而目前的 AI 还很难做到这一点。
对于大模型企业来说,相比提升技术力,更为困难的是,如何将 AI 的技术力,转换成企业乃至个人能够实实在在体会到的生产力。
而这,或许也该是未来大模型企业们努力的方向。
正如互联网出现之后被国人迅速开发,发展出各类新业态,在互联网的应用上,国内一直位于国际领先的地位。
未来,国内大模型企业的出路,也将在应用中逐渐体现。
登录后才可以发布评论哦
打开小程序可以发布评论哦