量子位 昨天
0博士组合拿下ICLR时间检验奖!两个GPT天才本科生+二本逆袭LeCun弟子,十年论文终封神
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

ICLR 2026 时间检验奖新鲜出炉,获奖者——

GPT 天才本科生Alec Radford

网友们纷纷送来祝贺:" 实至名归!"

Alec 为人相当低调,其社媒清一水的都是转发推荐他人优秀成果。

但实则他在 OpenAI 里是和 Ilya 齐名的技术大神,也是初代 GPT 系列奠基者

奥特曼曾称他为爱因斯坦级别的天才,OpenAI 总裁更是直言:

只要他想要的,我们都给。

如今,这篇他在十年前一作发表的DCGAN论文,终于正式封神!

引用量超 2w,是机器学习领域最具影响力的论文之一,也是公认的 GAN 工程应用开山之作。

而这篇论文之所以引人注目,还有另一层原因:

三位作者,没有一个是博士生

u1s1,这真的很酷!

时间检验奖首次颁给本科生

出乎意料的是,本届 ICLR 一口气开出个双黄蛋,两个时间检验奖分别是DCGANDDPG

前者直接影响了 GPT 系列模型的核心逻辑,后者则来自谷歌 DeepMind,证明了深度强化学习可以应用于连续控制。

这也是 ICLR 连续三年都在以时间检验奖的形式认可机器学习成果,也足见这两篇论文的经典程度不分伯仲。

组委会是这样评价 DCGAN 这篇论文的:

这篇俗称 DCGAN 的论文,首次成功验证了基于学习的生成模型能够生成多样化、真实且结构复杂的图像。

该研究成果正式开创了图像生成子领域,如今图像生成已是机器学习领域最热门的研究方向之一,同时在工业领域落地了大量成熟且成效显著的应用。

尽管相关技术不断迭代升级(从生成对抗网络逐步发展至扩散模型),但 DCGAN 依旧历久弥新,是奠定这一重要研究领域的关键里程碑。

本论文共有三位作者,2 个本科 1 个硕士

其中,Alec Radford本科毕业于富兰克林 · 欧林工程学院(Franklin W. Olin College of Engineering)。

据网友介绍,这是一所规模不大但实力不容小觑的工程院校。

通常只有 400 名学生,知名度虽不及哈佛、MIT 等同类科技学校,但它们的学生在项目方向上个人自由度高,学校学术能力媲美常春藤名校。

在那里,他和同学们一起创立了公司 Indico,并随后加入 OpenAI,一干就是八年。

他是最早期 GPT 系列论文的核心贡献者,几乎参与了 OpenAI 所有的重大突破,也是多模态模型CLIP的主导者。

他所提出的 Transformer 架构加生成式预训练的方法,直接奠定了后续 ChatGPT 和其它大模型的基础,同时也在 GPT-1 到 GPT-3、Whisper、DALL-E 的研发中担任关键角色。

截止目前,Alec Radford 的论文总被引数已超35 万

但在 2024 年底,Alec 正式宣布告别老东家,转而追求独立研究。在去年 3 月,他以顾问的方式加入了前 OpenAI CTO Mira Murati 创立的Thinking Machines Lab

和他同期进新公司的,还有前 OpenAI 首席研究员 Bob McGrew。

另一位本科生作者Luke Metz,和 Alec 都出自欧林工程学院,并在毕业后加入了 Alec 创立的 Indico 公司。

他也是 OpenAI 的初始成员之一,随后他进入谷歌担任长期研究员,研究重心从生成模型逐渐转向优化算法和元学习,并在 2022 年短暂回归 OpenAI,24 年底转投 Thinking Machines Lab。

最后一位作者Soumith Chintala,他广为人知的身份除了是 DCGAN 论文作者之一,还是 PyTorch 的核心作者、Meta 前副总裁。

他本科就读于韦洛尔理工学院(VIT),这是一所当地的二流工程院校,这也让他在申请硕士时屡屡碰壁,被 12 所高校连续拒绝。

直到最后,他终于坚持不懈收到了纽约大学发来的 offer,并成功收获 LeCun 青睐,得以师从 LeCun。在那里,LeCun 影响了 Soumith 的研究方向,他开始从事早期深度学习研究。

但在完成硕士学位后,Soumith 再次碰壁,几乎申请的全部工作都被拒绝,只能进入一家名为 MusiAmi 的小型创业公司,从事移动深度学习工作。

直到 2014,在 Lecun 的引荐下,他进入 Meta 工作,并带领团队成员主导设计了PyTorch。而 PyTorch 已经成为目前全世界使用最广泛的开源机器学习平台之一。

在 Meta 工作 11 年后,Soumith 一路从 L4 工程师晋升至副总裁,成为 Meta 核心人物。在 2025 年底,他离开了 Meta,并加入 Thinking Machines Lab 担任 CTO。

自此,DCGAN 三位作者兜兜转转,最终再次齐聚Thinking Machines Lab

其余获奖情况

除此之外,ICLR 还颁布了两篇优秀论文奖:

《Transformers are Inherently Succinct》:率先提出简洁性是衡量 Transformer 表达能力的新维度,同时证明 Transformer 在描述某些复杂概念时,相比 RNN 等模型存在指数级甚至双指数级优势。

《LLMs Get Lost In Multi-Turn Conversation》:设计了一种可扩展的方法来评估 LLM 的多轮对话能力,同时发现当交互涉及多轮对话和指令不明确时,LLM 的适应性和可靠性会大幅度下降。

和一篇优秀论文提名:

其中,研究者运用逼近理论,为主流 Muon 优化器设计了一套极分解设计最优多项式逼近方案,收获了业界一致的认可。

参考链接:

[ 1 ] https://blog.iclr.cc/2026/04/22/announcing-the-test-of-time-awards-from-iclr-2016/

[ 2 ] https://scholar.google.com/citations?user=dOad5HoAAAAJ&hl=en

[ 3 ] https://www.bostonglobe.com/2023/06/10/business/how-couple-olin-college-students-helped-spark-ai-chatbot-revolution/

[ 4 ] https://techcrunch.com/2025/04/08/mira-muratis-ai-startup-gains-prominent-ex-openai-advisers/

[ 5 ] https://timesofindia.indiatimes.com/etimes/trending/meet-soumith-chintala-indian-origin-techie-rejected-by-12-us-universities-now-cto-of-thinking-machines-lab/articleshow/126552880.cms

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

谁会代表 2026 年的 AI?

龙虾爆火,带动一波 Agent 与衍生产品浪潮。

但真正值得长期关注的 AI 公司和产品,或许不止于此。

如果你正在做,或见证着这些变化,欢迎申报。

让更多人看见你。 https://wj.qq.com/s2/25829730/09xz/

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

奥特曼 大神 爱因斯坦 本科生 机器学习
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论