vivo掏出手机端侧最大视觉生成模型，再发自研影像芯片，大秀空间视频能力

作者 | 云鹏

智东西 4 月 14 日报道，刚刚 vivo 在 X 系列蓝图影像技术沟通会上提前放出了一系列 vivo X200 Ultra 即将落地的最新影像技术突破。vivo 影像产品高级总监李卓提到，他们从镜头设计、画质提升、专业创作流三个维度对 vivo X200 Ultra 影像能力进行了重构。

vivo X200 Ultra 会采用蔡司三大定焦大师镜头及自研影像双芯片，从光学器件到芯片，再到模型算法和体验，vivo 已经构建了一套完整的影像技术方案体系。

在镜头配置方面，此次 vivo 和蔡司联合研发了 14mm 镜头搭配蓝图 × 索尼 LYT818 大底 " 鹰眼 " 超广角、35mm 镜头搭配蓝图 × 索尼 LYT818，第二代 85mm 蔡司 APO 2 亿超级长焦，共同组成三摄方案。

为了进一步提升 35mm 镜头的画质，vivo X200 Ultra 采用了 GLC 2.0 低反镀膜技术，将可见光波段的平均反射率降低至 0.1% 以下，让画面更纯净通透。

vivo X200 Ultra 的 14mm 超广角实现了进光量的提升，配合 CIPA 5.0 级防抖，以及蓝图夜景算法矩阵，能在拍摄宏大场景的同时捕捉更丰富的细节，同时可以实现 14mm 超广角星空拍摄能力。

vivo X200 Ultra 的第二代 85mm 蔡司 APO 超级长焦进光量较上一代提升 38%，进光量的提升让 vivo X200 Ultra 拍摄的长焦微距能呈现出更好的清晰度和更扎实的成像质量。

为了人像拍照，vivo 借鉴了专业机顶闪光灯的变焦功能，通过不同菲涅尔透镜方案设计，采用了变焦闪光灯技术，实现了广角灯加长焦灯的变焦功能。

vivo 还研发了闪光人像算法，闪光人像算法采用了总共约 6.5T 算力的模型，对光影及清晰度等多个维度进行计算复原。数据层面上，除了百万级别的模拟数据，vivo 闪光人像首次采用了 10W 量级的真实数据进行训练。

提到算法，这次 vivo 通过蓝图算法矩阵赋予了 10 亿参数到 vivo 视觉大模型里面，据称这是手机端侧最大的视觉生成模型，AI 的融入可以让夜景拍照更清晰、纹理更细腻。

依托超过 500 万份专业摄影数据集训练的自研视觉生成大模型，融合 2000TFLOPS 端云一体算力，vivo 还实现了一键直出 2400 万像素图像。

vivo 整合了自研 VS1 芯片的算力，并融入了 AI 大模型能力，基于海量高端审美认知进行引导学习，画面质感、肤质还原效果都更好。

据了解，VS1 芯片让手机首次具备 " 预处理 "+" 后处理 " 能力。VS1 芯片是 vivo 首款前处理大算力 AI ISP 影像芯片，采用了双核异构 NPU 架构。vivo 基于自研算法矩阵和芯片架构协同的设计理念，深度定制了 VS1 的 NPU 硬件架构和 MAC 阵列。

VS1 芯片实现了 16TOPS/W 的能效密度，数据能根据计算需求精准且快速地在不同层级缓存间流转，避免了数据拥堵，提高了数据读取速度。同时，VS1 芯片采用了多级 ISP+NPU 互联架构，集成硬件级 AI ISP 管线，可以实现低延时的内部数据处理。

VS1 芯片让 X200 Ultra 可以运行更复杂的神经网络算法，带来比以往更好的清晰度和噪声表现，同时达成了性能与功耗的平衡。

视频方面，全焦段 4K 60fps 10bit Log 视频提升了画面的色彩和细节表现，支持最高 14EV 动态范围。

此次 vivo 重点提到了空间视频。在今年 3 月的博鳌论坛上，vivo 首次展示了 vivo Vision 混合现实头显设备，vivo 称其为 X200 Ultra 空间影像的最佳观看设备。

据称 vivo 实现了手机行业唯一的 60fps 空间视频拍摄，并显著减少了画面拖影和卡顿感。

可以看到，vivo 在影像方面一直坚持自研与共研并行、软硬件结合，从硬件创新，到算法优化、用户体验，vivo 正在用技术创新给移动摄影带来更多可能性。

宙世代