文汇 06-29
同济教授获计算机视觉“学术奥林匹克”全球第一,拿下“大满贯”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

日前,在美国召开的 2025 年 IEEE 国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition,CVPR)上,备受瞩目的超可见光谱感知挑战赛结果揭晓,同济大学计算机科学与技术学院赵生捷教授团队在多模态视觉方向的 3 项核心挑战中以绝对优势荣膺全球第一,实现 " 大满贯 "。

该团队由赵生捷教授与汪昱助理教授联合指导,博士研究生饶季勇、刘宏丽及本科生钟航组成的参赛阵容,在与来自斯坦福、MIT、谷歌研究院等全球顶尖院校及科技企业的 300 余支精英团队的激烈角逐中脱颖而出。其科研成果获大会官方特邀进行主会场汇报,充分彰显了中国高校在多模态智能感知领域的国际领先地位。

本次 CVPR" 热红外图像超分辨率挑战赛 " 中,两大技术赛道吸引了全球顶尖科研团队角逐。其中,赛道 1 聚焦低分辨率红外图像的 8 倍超分辨率重建,该任务面临红外信号固有噪声干扰、细节纹理丢失与结构信息模糊等核心挑战。赵生捷教授团队创新性地提出基于 Swin Transformer 的多阶段图像超分辨率模型,通过多层次、多粒度特征提取和跨尺度特征重建突破了技术瓶颈。在竞赛中展现出显著技术优势,最终以优异指标斩获赛道冠军。

赛道 2 聚焦以高分辨率可见光图像为引导,完成低分辨率热图像的 8 倍与 16 倍超分辨率重建。针对传统算法在热图像高频细节恢复中存在的纹理模糊、边缘失真等痛点,赵生捷教授团队提出数据混合预训练 + 多尺度监督的创新技术框架,最终实现了 SSIM 的最优性能,斩获了该赛道冠军。

在本次 CVPR" 多模态航空视角图像分类挑战赛 " 的合成孔径雷达图像分类赛道中,赛事要求参赛者基于低分辨率 SAR 图像完成目标识别任务,并允许借助光学图像(EO)与 SAR 的配对数据开展跨模态训练。针对 SAR 图像固有的低分辨率、斑点噪声干扰,以及传统方法难以有效融合多模态信息的痛点,赵生捷教授团队提出 " 跨传感鲁棒识别网络 ",通过构建跨模态领域自适应框架实现技术突破,最终荣膺该赛事冠军。

CVPR 是全球计算机视觉、模式识别及人工智能领域最具权威性的顶级学术会议之一,由 IEEE(电气与电子工程师协会)主办,被学术界与产业界共同视为衡量研究水平的 " 黄金标准 ",甚至被称为计算机视觉领域的 " 学术奥林匹克 "。

文汇报记者了解到,赵生捷教授团队长期锚定多模态智能感知与视觉推理前沿领域,致力于构建人工智能、大数据分析与计算机视觉技术的深度融合体系。团队聚焦极端环境下的鲁棒感知、多模态数据语义理解与智能决策系统等关键课题,在跨模态特征融合、复杂场景推理及恶劣条件下的感知算法优化等方向形成系统性创新优势。其研究在自动驾驶环境感知、遥感目标识别、视频理解等领域积累了多项开创性成果。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

计算机视觉 分辨率 cvpr 智能感知
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论