智东西 20小时前
谷歌苹果华人大佬创业,融资3.5亿,或憋多模态模型大招
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

谷歌工作了 14 年的戴明博,与苹果的杨寅飞共同创立了 Elorian。

编译 | 万贵霞

编辑 | 云鹏

智东西 1 月 14 日消息,据美国科技媒体 The Information 报道,两位科技大厂前 AI 研究员——谷歌 DeepMind 前成员戴明博(Andrew Dai)与苹果前研究科学家杨寅飞(Yinfei Yang),联合创立了 Elorian 公司。该公司专注于开发能够同时理解和处理文本、图像、视频及音频的 AI 模型。

目前,Elorian 正在推进一轮规模达 5000 万美元(约合人民币 3.5 亿元)的种子轮融资,Striker Venture Partners 有望成为本轮领投方,双方洽谈已进入关键阶段。

戴明博出身于高知家庭,他父亲是机构学和机器人学领域大佬戴建生。作为 Elorian 的 CEO,他之前在谷歌 DeepMind 任职超 14 年,负责数据驱动型预训练相关工作。他深耕深度学习领域 20 年,曾在剑桥大学、爱丁堡大学攻读过学位,是机器学习方向的博士。

Elorian 另一位联合创始人杨寅飞,学生时期曾在南京邮电大学 Echo 实验室,参与差分进化算法参数控制相关研究,毕业作品 Apollo3D(阿波罗 3D)获苏州机器人世界杯第五名。他还参与癫痫诊断研究,开发 MRI 图像配准与可视化系统,之后在美国宾夕法尼亚大学攻读硕士学位。

在 AI 创业从 " 拼应用 " 转向 " 拼底层能力 " 的背景下,具备长期基础模型研究经验的华人科学家正加速走向创业前台,Elorian 成为近期视觉 AI 赛道中备受关注的案例之一。

01.

前谷歌 DeepMind 与苹果研究员联合创业

据 The Information 报道,Elorian 公司由戴明博与杨寅飞联合创立。

戴明博与杨寅飞的领英个人资料显示,二人目前就职于一家 " 隐形(Stealth)" 状态的公司,戴明博是该公司的 CEO。

业内普遍认为,这家 " 隐形 " 公司很可能是 Elorian。

▲ " 隐形(Stealth)" 的领英主页资料(图源:领英)

1、戴明博,深耕 DeepMind 14 年,担任 Gemini 预训练工作

据戴明博领英个人资料显示,他在谷歌 DeepMind 工作超过 14 年,是 Gemini 数据领域的联合负责人,担任 Gemini 预训练工作。

此前,戴明博曾参与谷歌 SGE 的建模工作,在谷歌大脑(Google Brain)从事自然语言处理研究,在谷歌健康(Google Health)从事电子健康记录研究,并参与了 Google Now 的开发。

▲戴明博(图源:领英)

在领英自我介绍中,戴明博写到自己在深度学习领域拥有丰富经验,研究方向包括自然语言理解和大型语言模型。

戴明博 2003-2006 年在英国剑桥大学计算机科学专业学习;2007-2012 年在爱丁堡大学攻读机器学习博士。

他过去 20 年来一直从事预训练相关研究。其研究主要集中在开发评估 AI 模型训练数据质量的技术,并确保模型使用来自各种不同来源的数据进行训练。

据相关报道消息,戴明博出生于高知家庭,他的曾祖父毕业于金陵大学(南京大学前身),爷爷毕业于厦门大学土木工程系。

戴明博的爸爸则是开辟了国际机构学和机器人学研究新领域的大佬、现南方科技大学机器人研究院院长戴建生。

▲戴明博在福建莆田的家庭合照,右下 1 为戴建生,左上 1 为戴明博(图源:公众号 angrysprite 不可言喻)

可能受父亲的耳濡目染,戴明博也攻读机器学习相关专业,从事谷歌 DeepMind 相关工作,且创立了 Elorian 公司。

2、杨寅飞,横跨谷歌苹果,主攻视觉和语言多模态模型领域

杨寅飞领英主页资料显示,他于 2022 年 1 月加入苹果,担任苹果公司 AI 机器学习部门的研究科学家。

▲杨寅飞(图源:谷歌杨寅飞主页)

杨寅飞在学生阶段就开始接触行业相关工作。据杨寅飞的谷歌个人介绍,2007 年 12 月至 2009 年 7 月,他曾作为研究助理在南京邮电大学 Echo 实验室进化计算研究组工作,参与设计了一种用于控制差分进化算法参数的新方法。

在本科阶段,杨寅飞完成的毕业作品名为 Apollo3D(阿波罗 3D),主要用于 Robocup 足球模拟器中的 Simu-Robot 动作设计。该作品曾在苏州机器人世界杯比赛中获得第五名。

▲杨寅飞的毕业作品 Apollo3D 图像演示(图源:Source Forge)

2010 年 5 月至 10 月,杨寅飞参与了一项跨校、跨国合作研究,与南京航空航天大学的郑刚及田纳西理工大学的 Forrest Sheng Bao 合作,围绕 AI 与脑磁图(MEG)结合的癫痫诊断软件展开研究,目标是验证机器学习方法在癫痫诊断中的可行性。

在具体实现上,他参与开发了一套用于 MRI 图像配准与可视化的软件系统,并结合基于 SAM-kurtosis algorithm(SAM [ g2 ] )计算的结果,对来自 CTF 脑磁图系统的数据进行处理。该项目源码已开源,并发布在 Source Forge 平台。

▲ MRI 图像可视化系统 CTF-SAM-OUT 的图像演示(图源:Source Forge)

2011 年 5 月至 2012 年 5 月,杨寅飞担任 Longin Jan Latecki 教授的研究助理,该教授是美国天普大学(Temple University)计算机与信息科学系的博士生导师。

▲ 2012 年,Longin Jan Latecki 教授发表论文《基于足迹检测的跟踪方法,实现对非静态目标物体的导航》,杨寅飞担任二作(图源:天普大学主页)

2012 年至 2013 年,杨寅飞在美国宾夕法尼亚大学攻读硕士学位,研究方向包括计算机视觉、机器人学和自然语言处理。

2013-2017 年期间,他先后在亚马逊和 Redfin 担任研究工程师,负责机器学习和计算机视觉领域的研究。

之后,他在谷歌任职超 4 年,从事自然语言处理的研究,包括语义检索(semantic retrieval)、多语言表示(multilingual representation)和多模态表示(multimodal representation)等。

2022 年,杨寅飞担任苹果公司 AI 机器学习部门的研究科学家,主要研究视觉和语言基础模型。

他于去年 12 月离开苹果,与戴明博一起筹划创立 Elorian。

02.

Elorian 能同时理解图像、视频和音频,

计划融资 3.5 亿元

戴明博在 The Information 的电话采访中说,Elorian 专注于构建能够通过同时处理图像、视频和音频来对物理世界进行视觉解读和分析的 AI 模型。

戴明博还说,虽然机器人技术是 Elorian 的一个潜在应用领域,但这家初创公司设想了许多其他应用,不过他并未详细说明。杨寅飞尚未对此置评。

视觉推理模型因具备多模态功能整合能力,专为机器人系统等复杂 AI 应用场景设计,从而节省开发人员拼接不同 AI 模型的工作量。

一些研究人员向外媒解释道,这项技术对于需要解读和理解图像以执行高级任务的 AI 智能体来说非常有价值。

在融资方面,外媒据戴明博和另一位知情人士透露,初创公司 Elorian 正在与投资者洽谈,计划进行约 5000 万美元(约合人民币 3.5 亿元)的种子轮融资。

该知情人士还说,由风投公司 CRV 前普通合伙人 Max Gazor 于去年 10 月创立的风险投资公司 Striker Venture Partners 正在洽谈领投此轮融资。

03.

结语:视觉推理 AI 成为巨头与创企关注焦点

从最早仅处理文本的大模型,到如今同时理解图像、视频与音频的多模态系统。这一被称为视觉推理的研究领域,如今已成为包括谷歌、OpenAI 和 Anthropic 在内的众多大型 AI 提供商和初创公司的关注焦点。

Elorian 的出现,正是这一浪潮中的缩影,其能否在视觉推理这一关键赛道中跑出差异化路径,仍有待时间验证。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 deepmind 领英 融资
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论