快科技 3 月 19 日消息,3 月 16 日晚间,特斯拉 CEO 马斯克在社交平台公开发声,点赞中国人工智能企业月之暗面(Kimi)团队的最新技术成果,直言这项工作 " 令人印象深刻 ",将这款国产大模型的前沿研究推向公众视野。

伴随技术论文同步公开,作者名单中位列首位的 Guangyu Chen(陈广宇)引发全网关注——这位核心作者竟是一名年仅 17 岁的在读高中生,来自广东深圳。
据论文附录标注信息显示,陈广宇与张宇、苏剑林三人同为同等贡献共同第一作者,其余 34 位参与作者均未标注该资格。
其中,张宇是 Kimi 高效模型架构的核心研发人员,苏剑林则是旋转位置编码(RoPE)的提出者。
值得一提的是,陈广宇真正深耕 AI 领域仅一年时间。起步阶段,他凭借自主研读前沿论文、追踪 GitHub 开源项目等方式,快速补齐 AI 基础知识与实践能力。
去年暑假,他远赴旧金山完成 7 周实习历练,回国后于去年 11 月加入 Kimi 团队参与实习。
论文发布后,陈广宇在朋友圈发文复盘成果,特意提及三位同等贡献作者,以及负责模型扩展、基础设施搭建的团队同事。他低调回应称 " 是团队成果,不要造神。"
据报道,Kimi 团队发布的这项技术报告,提出全新 Attention Residuals(注意力残差)机制,对深度学习领域沿用近十年的传统残差连接实现颠覆性重构。
Kimi 的创新相当于给 AI 装了 " 智能筛选器 ",将 Transformer 注意力机制迁移到模型深度维度,让每一层动态筛选此前有用信息、压低冗余,提升传递效率。



登录后才可以发布评论哦
打开小程序可以发布评论哦