智东西
作者 | 陈骏达
编辑 | 李水青
智东西 6 月 26 日报道,近日,计算机视觉大牛、MIT 教授何恺明入职谷歌 DeepMind,他在个人主页上更新了自己的最新职位——谷歌 DeepMind 杰出科学家(兼职)。同时,何恺明也仍然保留了 MIT 电气工程与计算机科学学院(EECS)的终身教职。
何恺明是深度残差网络(ResNet)的提出者之一。他作为第一作者发表的 ResNet 论文《Deep Residual Learning for Image Recognition》,是 21 世纪被引次数最多的论文。
文中所提出的残差连接在现代深度学习模型中无处不在,包括 Transformers、AlphaGo Zero、AlphaFold 以及当今几乎所有的生成式 AI 模型。截至今年 5 月,何恺明的各类出版物总被引量已经超过 70 万次。
2024 年加入 MIT 之前,何恺明始终活跃于产业界与学术界,曾陆续在微软亚洲研究院(MSRA)、Facebook AI 研究院(FAIR)担任研究科学家。他拥有清华大学物理系基础科学班学士学位和香港中文大学信息工程博士学位,在本科期间,曾在微软亚洲研究院视觉计算组实习,师从计算机视觉大牛孙剑;在香港中文大学期间师从香港中文大学多媒体实验室创始人、商汤科技创始人汤晓鸥。
除了 ResNet 之外,何恺明还曾发表多项极具学术价值、对 AI、计算机视觉产生深远影响的研究成果。
2009 年,在香港中文大学期间,何恺明在其第一篇发表的学术论文中提出了 " 图像去雾算法 ",这篇论文一经发表便斩获了当年度的计算机视觉顶会 CVPR 年度最佳论文奖,何恺明也成为 CVPR 历史上首位获此殊荣的华人。
2015 年,何恺明在微软亚洲研究院工作时提出的 ResNet 在 ImageNet 图像识别大赛中夺冠,相关论文获得了 2016 年的 CVPR 最佳论文奖。
在 FaceBook AI 研究院工作期间,何恺明还在图像分割领域做出重要贡献,作为第一作者和第二作者分别发表了 Mask R-CNN、Faster R-CNN 两篇重要论文。相关研究将图像分割的准确度和效率提升到新的水准,Mask R-CNN 论文获得了 2017 年的 ICCV 最佳论文奖。
何恺明还曾获得 2018 年 PAMI 青年研究员奖、ECCV 2018、CVPR 2021 最佳论文荣誉奖和 ICCV 2021 埃弗林汉姆奖等著名奖项。
目前,谷歌 DeepMind 和何恺明本人都尚未披露后者入职后具体的安排。不过,我们可以从何恺明近期在 CVPR、NeurIPS 大会上的分享中,了解到他眼中具有学术价值的研究方向。
自 AlexNet 以来,识别模型已普遍实现端到端训练和推理,但当前主流的生成模型在概念上类似于 " 分层训练 ",通常涉及多个步骤的推理与计算。何恺明带领的团队已于 2025 年发表了单步生成模型理论框架 MeanFlow。未来,他可能会持续探索适用于端到端生成建模的框架。
同时,何恺明还称识别与生成是一体两面的问题,识别是从数据到嵌入的 " 流动 ",而生成是从嵌入到数据的 " 流动 "。未来,识别与生成一体化的框架也可能成为其重要研究方向之一。
在 2024 年于 NeurIPS 大会上分享时,何恺明强调:" 未来才是真正的测试集 "。他主张研究者应该关注尚未见过的新数据、新配置、新用例和新情境,以减少研究的 " 过拟合 "。
在同一场大会上,何恺明称研究的本质在于寻找 " 惊喜 "。在加入谷歌 DeepMind 后,我们或许可以期待他带来更多令人惊喜的科研成果。
登录后才可以发布评论哦
打开小程序可以发布评论哦