智东西 1小时前
字节跳动VP复盘12年发展!剧透明年PICO新品、全自研MR芯片
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 程茜

编辑 | 李水青

智东西 11 月 26 日消息,11 月 24 日,字节跳动技术副总裁杨震原在 2025 字节跳动奖学金颁奖典礼上发表演讲,他透露 2026 年 PICO 将有新品发布。

为提升 MR 技术中虚拟物体和现实世界的融合度,PICO 为 MR 设备全链路自研了专用消费级芯片,2022 年 6 月立项、2024 年回片,目前已进入量产,实测显示,芯片系统延迟在 12 毫秒左右。

字节跳动副总裁杨震原

杨震原于 2014 年加入字节跳动,从最初帮助字节跳动创始人张一鸣搭建新的推荐算法至今已接近 12 年。他在演讲中回顾了字节跳动几个重要的技术发展节点:

2014 年,他们用大规模机器学习系统来搭建推荐系统,在仅有 5 个人的情况下,只能选两个人各自负责一套优化器方案;

2020 年字节开始探索科学计算产生的有价值数据;

2021 年收购 PICO,2023 年因硬件体验不成熟,内部决定减少内容和营销投入,坚定技术投入。从技术成果来看,PICO 最终成品目前平均 PPD(每度像素数)达到 40,中心区域超过 45,属于行业领先水平;通过 MicroOLED 定制提升 XR 设备清晰度;字节全链路自研的 MR 头显专用消费级芯片目前进入量产。

最后是大模型方面,2021 年字节内部就有员工训练了大语言模型,但当时他们得到的结论是,大模型目前没什么用。杨震原说,这也说明当时他们很没眼光。

这也对应了此前 PICO 被曝产品计划更改、裁员以及计划研发 MR 设备的消息。

2023 年 12 月,据外媒 The Information 报道,PICO 计划取消原有 PICO 5 的研发计划,转而研发高端 MR 头显,对标苹果 Vision Pro。同一时期,PICO 还被曝开启裁员、调岗,从 2023 年年初的 1800 余人团队,缩减至 800 余人。

今年 7 月,PICO 被曝正在研发一款 MR 设备,计划将数字内容叠加在现实世界视野中,直接对标 Meta 即将推出的轻量级 MR 设备。

以下是演讲全文的关键内容总结:

2014 年,张一鸣想用大规模机器学习系统来搭建推荐系统,解决各种媒体形式,包括图片、文字、视频的推荐,他们计划 2014 年做到万亿级别的特征规模。

杨震原提到这背后在优化算法方面的挑战,LR 的优化是成熟技术,但不同的方法效率、效果差异巨大。字节内部当时仅 5 个人,只能选两个人同步负责两套优化器方案,同步进行调研。

2014 年底,字节逐渐引入 FM 类算法,后来演化成更通用的深度学习体系。如今,其已发现面向模型训练环节的流式更新、较浅层的神经网络算法在推荐中依然有不错的效果。

2020 年,他们意识到科学计算能产生很多有价值数据。

字节跳动在第一性原理计算、分子动力学上进行了探索。今年,字节和比亚迪成立了联合实验室,会将高通量自动化实验与科学计算算法结合,探索 AI for Science 在电池材料领域的工业落地应用。目前,GPU 加速 DFT 计算、力场 + 分子动力学模拟、预测 + 设计模型均已投入字节企业合作伙伴进行实际应用。

2021 年,字节收购了 PICO 团队,开始同步推进两个产品路线,一是以当前的产品形态为主,同时投入资源运营视频、直播等内容,较为激进的营销;二是投资基础技术,追求核心体验上一个大台阶。

杨震原透露,2023 年,其内部决定减少内容和营销投入,更坚定的投入技术路线。这是因为当时产品的硬件体验尚未成熟,无法支撑大规模市场应用。

杨震原列举了目前 PICO 探索的几条技术路线,包括 XR 设备清晰度、MR、交互。

清晰度方面,他们最终的成品平均 PPD(每度像素数)达到 40,中心区域超过 45。杨震原说,这应该属于行业领先水平。PPD 指人眼睛看一个度大概有多少像素,PPD 大于 30 大概可以看文字,40 会比较清晰,到 60 的视觉体验会接近视网膜级清晰度。

为了提升 XR 设备的清晰度,2022 年 PICO 和供应商启动了 MicroOLED 定制,这使得光学显示系统得以进一步缩小,从而让 MR 头显轻便的同时获得更高的 PPI 和整体清晰度。

MR 设备需要专用芯片,2022 年 6 月,字节跳动内部立项,全链路自研了一颗 MR 头显专用的消费电子芯片。芯片于 2024 年回片,目前已进入量产阶段,各项指标均达到设计要求。

其实测显示,系统延迟可以做到 12 毫秒左右,杨震原称,这非常不容易,即便是世界顶尖公司用软件来做,也很难在不明显牺牲画质的前提下把延迟压到 25 毫秒以内。

还有交互层面,PICO 建设了专业的高精度测试系统、专门的 3D 重建机制与高精度手势数据采集系统等,以对现实环境做识别等。

2023 年,进入大模型时代,字节跳动开始大力投入。

2021 年,字节内部就有员工训练了大语言模型,但内部将其用于改进搜索发现效果并没有提升。因此当时他们得到的结论是,大模型目前没什么用。杨震原说,这也说明当时他们很没眼光。

2022 年开始投入至今,豆包已经成为国内最流行的 AI 对话助手,根据 IDC 的报告火山引擎是中国 MaaS 市场的第一名。

杨震原还分享了他对如何评估是否达到 AGI 的看法,第一是如何让大模型提高学习能力,第二是 IO 能力,也是 AI 和世界交互的能力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

字节跳动 芯片 机器学习 裁员
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论