申妈的朋友圈 2小时前
一段话锐评互联网大厂大模型团队
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

从 2023 年 ChatGPT 横空出世到现在,大模型已经在中国发展了三年有余,让我们看看中国互联网大厂的大模型团队如果用一段话来来描述。

据此前《晚点 Latepost》报道,字节 Seed 团队人数在 1500 人以上,是整个中国互联网大厂中大模型团队人数最多。由于人才密度过大,现在 Seed 部门的招聘要求已经高到有些 " 变态 ",普通的清北博士已经不太够用了。

字节对大模型人才,在职级和薪水上不设上限,很多刚毕业,有顶会论文加持的名校博士就能拿到 3-1 以上的职级和比较高的薪水。据此前《晚点 Latepost》报道,有一位 2024 年毕业的清华博士,直接向吴永辉和周畅汇报。除了基础的薪水和字节期权外,2025 年 8 月,Seed 团队实施期权增发计划和豆包股计划,在薪水上的竞争力更强了。

Seedance2.0 的出现,让 Seed 在多模态领域遥遥领先,对相关的研究人员来说,吸引力非常大。

在大语言、多模态、语音,AIcoding 等领域,通义系大模型在中国都算是第一梯队(或者 1.5)。同时,有比较深的人才厚度,在周畅和林俊旸都出走的情况下,通义依然有足够的人才来支撑后续的模型发布和升级。

不过,由于阿里集团的职级和薪资体系过于成熟,暂时还不能给年轻人比较高的职级和薪水,导致通义团队目前在招聘方面比较吃亏。只能在校招时挖角好苗子,但由于职级薪水不高,很多优秀人才工作一段时间后被其他公司挖走。

前期过于谨慎,在 AI 基础设施和人才方向的投入不够,导致发展缓慢。从 2025 年开始,奋起直追,还以薪水翻番的条件从其他公司挖了不少人,对校招生的职级和薪水,给的也比较大方。但从效果来看,作用还不是很明显。基础语言模型表现中规中矩,多模态生成至今还未成型。

DeepSeek

精兵:在此前融资大规模招聘之前,Deepseek 的团队规模一直维持在一一两百人,是所有大模型公司中团队人数最少的,但产出却很好,可见 DeepSeek 员工的员工能力。因为对员工能力要求的极致,DS 员工的招聘标准也是整个中国 AI 公司中最高的。

但由于人数太少,被挖走几个人就能造成很大的影响,这也是梁文锋在融资时对 VC 和大厂的基本要求:不能从 DS 挖人或者撺掇他们去创业。

作为一个短视频平台,快手在多模态模型上表现突出,可灵是 Seedance 之外最好的视频生成模型,但在大语言模型上完全缺失。

在互联网大厂中,快手的薪资一直属于比较高的那档,毕竟公司规模和其他大厂比,还是有一些差距,靠钱多来弥补平台较小的不足。

虽然美团 longchat 的评价据说还不错,但在普通用户心目中,几乎没有什么存在感,基本就是小透明。毕竟美团主要业务是生活服务,缺乏训练大语言模型和多模态模型必要的预料,也缺乏使用场景。不过据说还挺舍得给钱的。

2024 年之前还有一些优势,但后劲不足。

虽然一直在投入,挖人时也挺舍得给钱,但 AI 业务的受重视程度还是不太够。

京东、某某某、滴滴,几乎没啥声音,不做评价。

至于 KIMI,MINIMAX,智谱等公司,不在我关注范围内,不做解读。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

互联网 快手 融资 阿里 ds
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论