盖世汽车 03-20
麻省理工学创建“FeatUp”系统 可以让算法同时捕获场景内所有高级和低级细节
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

盖世汽车讯 想象一下看一会儿繁忙的街道,然后尝试勾画出从记忆中看到的场景。大多数人都可以画出汽车、人和人行横道等主要物体的大致位置,但几乎没有人能够以像素完美的精度画出每个细节。大多数现代计算机视觉算法也是如此:它们非常擅长捕捉场景的高级细节,但在处理信息时会丢失细粒度的细节。

据外媒报道,麻省理工学院(MIT)的研究人员创建出名为 "FeatUp" 的系统,可以让算法同时捕获场景的所有高级和低级细节——几乎就像计算机视觉的激光近视手术一样。

图片来源:麻省理工学院

当通过查看图像和视频来学习 " 看 " 时,计算机会通过称为 " 特征 " 的东西建立对场景中内容的 " 想法 "。为了创建这些功能,深度网络和视觉基础模型将图像分解为小方块网格,并将这些方块作为一个组进行处理,以确定照片中发生了什么。每个小方块通常由 16 到 32 个像素组成,因此这些算法的分辨率比它们处理的图像要小得多。在尝试总结和理解照片时,算法会损失大量像素清晰度。

FeatUp 算法可以阻止这种信息丢失并提高任何深度网络的分辨率,而不会影响速度或质量。这使得研究人员能够快速、轻松地提高新的或现有算法的分辨率。例如,想象一下尝试解释肺癌检测算法的预测,以定位肿瘤。在使用类激活图(CAM)等方法解释算法之前应用 FeatUp,可以根据模型产生肿瘤可能所在位置的更加详细的(16-32x)视图。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

分辨率 麻省理工学院 肺癌 计算机视觉 计算机视觉算法
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论