想要打造 " 物理空间版 ImageNet" 的宋知珩,是个很有反差的创业者。
他有些文艺天赋。绘画拿过全国一等奖,画了 12 年黑板报,每次都是第一。但后来他学了工科、做了硬件。
他毕业时拿到了好几个大厂 offer,却觉得 " 人生有些苦早晚得吃 ",转头去初创企业,从最基础的工程师做起,拿几千块钱的工资。
他本已在机器人明星公司做出一番成绩。在镁伽,他从 0 到 1 做出过亿营收的产品;在智元,他担任双足人形整机的产品负责人。但当看到数据是卡点时,他约上朋友,投身创业。
而这些反差背后,似乎正是新一代科技创业者的特质。
他们一方面极度理性,对技术、产业、产品乃至人生规划,有自己清醒的认知——虽然未必全然正确或靠谱;另一方面又极度浪漫,对未来有着宏大的想象和愿景,并且深信不疑。
以前的创业者言必称乔布斯,现在的创业者同样喜欢乔布斯,但他们似乎越来越像要把人类送上火星的马斯克。他们像前者一样,喜欢把科技产品打磨成艺术品;像后者一样,习惯把创业放到文明的尺度里衡量。
对宋知珩和他创办的星忆智能来说,他们的宏大故事,是构建下一代具身智能的数据基建。就像 ImageNet 以高质量数据集推动了 AI 浪潮,星忆想用高质量真实数据加速具身智能的演进。
他们相信,人类的经验、知识、技艺乃至智能,藏在文字、语言、姿态、动作等种种数据里,并将其视为人类的遗产。他们要把这些数据采集起来,再交给机器人。
这样既能让机器人真正学会干活,也能让机器人帮着传承人类文明。比如那些即将失传的非遗手艺,当机器人学会了,就再不用担心没有 " 人 " 来继承了——这并非抢夺手艺人的饭碗,而是为濒危的技艺续命。
这,就是星忆正在做的事。
星忆智能创始人兼 CEO数据即智能,但具身数据太少了
不久前,星忆所在的 AI 原点社区的负责人来问宋知珩:" 还需要什么支持?" 他没提补贴,也没要办公空间,而是说,希望园区能开放更多真实场景,让他们采集数据。
对具身智能来说,数据越来越重要。
国家层面也在释放信号:最近一个月,先是国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》,随后工信部、国务院国资委又发布《2026 年度人形机器人与具身智能实景实训专项行动》。前者指向高质量数据集的建设和供给,后者则要加速机器人在真实世界里积累经验。
资本和业界对数据价值的判断也在变化。
不管是谈 AI 还是谈具身智能,有人觉得模型更重要,有人觉得数据更重要。星忆的立场是:数据本身非常关键,决定了模型上限。但在创业之初,业界的认知分歧还比较大,他们要花很大精力去和投资人、合作伙伴达成共识。如今天平向数据倾斜,星忆再讲自己的规划和目标,也方便多了。
但眼下对数据的重视,未必到位。
最近几年的故事一再表明,大家总会低估 AI 产业的某个环节。起初大家盯着模型参数,后来发现算力才是门票;算力火了之后,又发现发电、供电、散热才是瓶颈。对于数据的价值,至今仍有不同判断。宋知珩的判断非常简洁:" 数据即智能 "。
机器人现在能打拳、会跳舞、可以跑马拉松,但一直没办法好好地进厂干活,核心原因,便是没有好的具身模型去驱动机器人完成操作。至于为什么没有好的模型?关键的卡点在 " 数据 "。" 所谓模型,就是从一堆数据里把智能提炼出来。"
宋知珩解释,就像李飞飞的 ImageNet 发布后,催生了人工智能的进一步发展," 没有高质量数据集,就无法产生质变。"
原理想汽车的智能驾驶研发总监 Leo,最近加入了星忆。他的亲身经历,验证了数据有多重要。
自动驾驶发展了十年,最初是规则驱动,全是 "if else" 的代码,行业进展很慢。后来用大量数据训练模型,汽车才具备了认知能力,能理解道路和场景,实现了城市 NOA(Navigate on Autopilot,城市导航辅助驾驶)。
实际上,自动驾驶可以看作具身智能的一个早期形态。这个阶段验证过的数据驱动逻辑,到了机器人阶段,自然也会适用。
不过具身领域的数据还很稀缺。大语言模型有海量的互联网数据可以训练,可人到底怎么干活——姿态是什么、视觉看到什么、触觉摸起来什么样,这些从没有被大规模地、对齐地记录下来。
而星忆就是要做这种记录,构建一个" 物理空间的 ImageNet"。
人类即答案,押注第一视角
数据重要,但也不是什么数据都能提炼出智能。好的数据意味着智能,糟糕的数据则是干扰智能的噪声。
而相比大语言模型,具身智能对数据质量的要求更加严苛。chatbot 缺乏高质量数据,后果是答错问题;具身智能缺乏高质量数据,可能会 " 打错人 "。
对星忆来说,他们要采集的,是来自第一视角、有高精度、高自由度和真实物理反馈的数据。
先说第一视角。
过去几年,行业里对具身数据的采集并没有统一答案。有人用仿真数据,让机器人先在虚拟环境里练习;有人用真机遥操,再记录机器人的传感器信号和动作轨迹;也有人尝试利用网络视频,让模型从海量人类行为中,学习任务步骤和动作先验。
而在今年 2 月,一篇来自英伟达等机构的 "EgoScale" 论文,让业内更加重视 "egocentric human data",也就是人类第一视角数据的路线。
论文中的实验显示,当第一视角人类操作视频扩展到 2 万小时量级时,VLA 模型的动作预测损失会随数据规模呈规律性下降,并能转化为真实机器人灵巧操作能力的提升。也就是说,当模型看过越多 " 人怎么干活 " 的案例,就越能预测人在某个场景里下一步会怎么动,并将对人类动作的理解,最终转化为自己的操作能力。
换言之,人类有机会成为具身智能时代最可规模化的数据源了。
这被视为机器人 scaling law 的一个节点。而在英伟达论文发布之前,星忆就已经明确了 ego 路线,宋知珩的判断更早:" 这个世界是人类创造的,人类身上就藏着正确答案。"
相对于英伟达的 EgoScale,星忆还有自己的独家能力。
" 英伟达在做 EgoScale 的时候,是在类似实验室的洁净场景里采集,这样物体和手部位姿很容易提取。我们的算法足够鲁棒,能在各种真实场景里,不管有没有遮挡,都高精度地提取位姿。"
能拿到更多场景的数据,才好让机器人到更多场景去替人干活。

星忆智能数据采集解决方案
但只是场景多也没用,更关键的是质量要高。星忆在数据上有三个特别看重的维度,三者合起来,构成了他们认为的 " 高质量 "。
首先是更高精度。各家模型在收 ego 数据时,开源算法的精度多在一个厘米以上,而星忆可以达到人类专家的毫米级水平,且没有人类的 bias,同时能应对各种真实场景中的遮挡。" 这个水准在业内是唯一的。"
其次是更高自由度。这区别于二指夹爪方案。夹爪只有一开一合,是两个自由度;而人的手包含 21 个关节点,二十多个个自由度。星忆追求通用泛化能力,要让机器人的末端执行器能变换各种姿态、操作各种物体,高自由度的数据必不可少。
真实的物理反馈(触觉),是星忆数据中很有辨识度的一环。把触觉数据作为具身智能训练数据的一部分来系统采集,是近几年明显升温的趋势,但至今仍是少数派的做法。
宋知珩指出,要同时采集手部姿态和触觉,需要戴着触觉手套,这时对算法的要求更高," 目前能够做到这件事的,只有 Meta 和星忆。" 而在他眼中,触觉是绝不可以忽视的。
触觉让机器人知道 " 拧螺丝用多大力气 ",而不仅仅是模仿动作。" 我们想赋予机器人感受的能力。"
为了获取触觉数据,星忆把手套里的传感器做得足够薄、足够灵敏、足够密、线性度足够好," 这样采回来的数据置信度才高。" 另据宋知珩介绍,对比 Meta 只能识别肉色手套,星忆可以识别各种颜色的手套。
这也是一项重要突破。" 工人戴白手套,医生戴蓝手套 ",能识别不同颜色,进一步强化了星忆面向不同场景的数据采集能力。
总的来看,星忆对比同行,裸手 + 手套采集,可以进入到更多场景,采集到更高质量的数据,并让机器人可以处理更复杂而精细的任务——比如给手机安装摄像头,帮修表的老师傅安装细小零件,学习医生做手术的动作,或是像非遗传承人一样做手工艺活……
如果机器人可以完成这些任务,那么生活与生产环境中大部分更简单的任务,也就不在话下。
系统才是壁垒,成本降至几百分之一
高质量数据之外,成本是商业化的命门。
相对于要买机器人、搭场景、招人、租场地的遥操数采,星忆数采的总成本可以降到十分之一;在人工标注环节,星忆能用百分之一的成本,实现更高的质量。" 一秒钟视频 30 帧,每帧要标双手 42 个关节点,星忆做到接近百分之百的自动标注,足够有优势。"
事实上,星忆真正的优势,是一套系统工程。
用宋知珩的话来概括:在硬件端,星忆知道用什么样的硬件能把最高质量的数据采集回来,知道如何做好毫秒级的多传感器同步和高精度的多相机参数标定,乃至能引导设备的研发和设计;在软件端,除了更好的标注算法,星忆还知道在数据处理上如何更好地压缩、清洗、脱敏。
由于有高质量数据标注的核心认知,我们会引导自己做出一整套行业最高水平的系统。这是宋知珩引以为豪的地方。在他看来,具身智能最底层的竞争,是把真实世界经验转化为机器人能力的系统效率竞争。
而星忆的底层竞争力,是通过团队的搭建和组织,把学术、工程和产业上的链路难点充分打通。这让他们既懂如何采集真实世界的数据、如何把这些数据沉淀为可训练的资产,也懂如何让模型基于这些资产完成学习,并在真实场景中持续验证。
星忆的团队,是典型的高精尖人才团队。几十人中,超半数来自清华和北航,也有来自北大、Berkeley、USC 的核心成员,九成以上是 985 背景。宋知珩本人就来自清华——不仅在清华读书,还与同学联合发起成立了清华 MBA 具身智能俱乐部,担任创始副主席。同时,也有像 Leo 这样的产业老将加入星忆,补上了从 " 科学 " 到 " 工程 " 的关键拼图。
这从另一个角度说明了发展具身智能所需要的系统性能力。而把视野再打开一些,会发现,整个具身产业都需要系统性的协同。
这时不妨再说说星忆所处的位置。今年春节后,星忆决定搬到位于北京海淀区的 AI 原点社区,搬家最重要的理由是:这里离清华足够近。
" 作为清华学生,我更愿意出校门两三百米就到公司,而不是走三公里五公里,这样不管是实习还是参与项目都方便。当清华实验室的一线研究员分享最新成果时,宋知珩还会去旁听和交流。" 他说:" 这对做数据很关键。"
而这段故事,不只说明星忆和清华的关系紧密,也说明整个具身智能产业离不开顶尖高校的滋养。
每个产业和每个巨头的兴起,往往都需要特定的土壤。就像比亚迪和大疆需要深圳的电子制造产业链和高密度工程师,具身智能和大模型也需要北京的独特资源。
智能崛起于北方,海淀的具身故事
提到机器人,大家往往最先想到杭州或深圳,但说到智能,北京无疑是第一高地。
眼下具身产业的分布呈现出越来越清晰的格局:" 越往南方越偏制造业和本体,越往北越偏算法、数据和模型,因为北京的人才密度更高。" 星忆所在的海淀地区,人才密度尤其高。宋知珩要离清华近一点,其实星忆附近不只有清华。
仍以 AI 原点社区为例,这里有几个数字独一无二:1 公里半径内,汇聚了 30 余所高校和科研机构、超过 1000 位人工智能科学家以及 1.3 万名开发者。这些都为包括星忆在内的科创新星,提供着源源不断的智识滋养。
还没完。除了最高密度的科教人才,这里还有超高密度的业界资源。
" 智谱就在旁边,是中国大模型的标杆。还有 Kimi、深言、面壁,模型的基因很好。对星忆来说,做数据天然需要和模型团队频繁交流。企业、人才都在这,交流非常充分。周六日大家能很方便地去小酒馆、学校里聊天。交流速度越快,认知密度越高,才能真正引领行业和时代。"
实际上,海淀早就意识到了具身智能的价值。
早在 2024 年,海淀区政府便联合北京市发改委等部门印发了一份《关于打造全国具身智能创新高地的三年行动方案(2024-2026 年)》,明确提出要 " 打造全国具身智能创新高地 ",并以大模型等人工智能技术突破为引领,聚焦具身大模型和机器人整机,部署实施六大行动。
而在今年 2 月,《海淀区 "1+X+1" 现代化产业体系建设布局》正式发布,塔身的 "X" 定位 5 大战略性新兴产业和 3 大未来产业,具身智能被纳入三大未来产业之一。同时,海淀区发布总规模达 100 亿人民币的中关村科学城科技成长基金四期及成果转化基金,也为包括具身智能在内的硬科技企业的加速成长,提供了稳定的资本保障。
而在政策与资本的双轮驱动下,各类科创生态活动也同步跟进。今年 4 月举办的 "2026 投海 Tech Show" 专场活动,就为硬科技企业搭建了一个高效的展示对接平台。14 家区域内科技企业同台亮相,与上百位投资人展开交流。为确保展示效果,海淀为活动提前组织专业路演培训;结束后,为项目安排投资对接会,形成了全流程科创生态服务闭环。
星忆也在这次的活动上亮相,并被观众票选为 " 最感兴趣项目 "。
以上各类资源和政策,共同撑起了海淀的产业创新生态。眼下,海淀正形成以 " 大脑、小脑、本体 " 为核心的全产业链条,并且这个链条正变得越来越健壮。
星忆自然也能从中受益。他们的愿景足够大,要走的路非常长,而整个具身智能产业仍在早期,需要更多养料来支撑遥远的梦。
星辰与记忆:一家公司的终极浪漫
回到创业的原点。
在定义自己要过怎样的一生时,宋知珩想到两件事:对内,追求丰富的人生体验;对外,尽可能多为这个世界产生正向影响。星忆是这两者的交汇点。
而星忆的梦是这样的—— " 我们想为人类社会做点什么。一定程度上可以说是‘解放人’。"
宋知珩解释,过去有接线员,有了交换机之后接线员就没了;过去有收银员,二维码出现后收银员也大幅减少了。现在人类正迎接一个更美好的世界,星忆想让机器人进入各种真实场景里去干活,让人可以去追求自己更想追求的事情。
" 人是一个挺有追求的生物,当能力不断被放大和赋能,他一定会有更大的追求,甚至超越地球范围。人类会进入新局面,在思想、意识、精神层面进一步觉醒。"
宋知珩曾深入思考过 AI 的 " 善恶 "。他与 Gemini 讨论了一下午,得出结论:如果 AI 比人类更聪明,它一定会比人类更深刻地意识到,在浩瀚宇宙中,能产生人类这种高级智慧是多么稀缺。
" 人类尚且能意识到生物多样性的重要性,AI 一定会更加珍惜这盏宇宙中的烛光。" 这种思考让他更笃信现在所做的事的价值。
而他设想的未来图景既狂野也很浪漫。早先的创业者对此很难想象,但现在的创业者大概都有共鸣。这或是 AI 时代创业者的特权。
事实上," 星忆 " 这个名字本身就映照着宋知珩的志趣。
它有两层意思:第一层,是希望星忆这个组织能做一点让世界记住的事。第二层,他们把正在记录的、人类创造世界的种种精细操作,视为 " 人类的遗产和记忆 "。
人类是善忘的生物。语言会退化,手艺会失传。但被机器人记录下来的姿态,可以在这个星球上——或者说星际之间,永远地传承下去了。而星忆要做的,就是为那次 " 觉醒 ",准备好最初的 " 记忆 "。



登录后才可以发布评论哦
打开小程序可以发布评论哦