量子位 前天
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

生数科技前产品副总裁廖谦创业了

在此之前,他还先后担任过字节剪映与火山引擎前 AIGC 产品负责人。

8 月底从老东家离职后,公司成立仅半个月,就已经拿下了硅谷美元基金 HT Investment 与 BV 百度风投的数百万美元投资。

他要做的是一件看起来很 " 产品人 " 的事——

打造面向营销场景的多模态 Agent,同时将逐步构建新时代 AI 信息表达系统。

他给公司起名为极致上下文(Apex Context)

这个名字来自他对下一阶段 AI 发展的理解:AI 应该能深度理解并呼应用户的上下文,让生成的内容更精准、更贴合预期。

从人文一点的角度出发,他说这个名字背后是极致上下文的公司文化,希望它有 " 更多的 Context,更少的 Control"。

廖谦学计算机视觉技术出身,一路打拼,创业前最后一份工作的 title 是 " 产品副总裁 "。

早年,他在鹅厂、字节推动很多项目从 0 到 1,也在生数科技这样的初创 AI 公司留下拿得出手的漂亮成绩。

问起他对自己的评价,廖谦说从最早期的生成式 AI,到如今多模态阶段,自己一路从算法到产品,再到商业化的完整路径都走过;做过国内市场,也做过海外市场;待过大厂,也有 0 到 1 的创业经验," 对于‘技术如何变成产品价值’这件事,有比较系统的理解,也有足够的实操经验。"

所以,当做出自己创业这个决定的时候,廖谦没有迟疑。

AI Agent 创业,极致上下文要做什么?

今年 8 月底,廖谦正式成立极致上下文。

公司的首要目标是打造面向营销场景的多模态 Agent

营销是个生产力方向,很垂直,落点也很明确。

把营销场景作为切入的具体路径,无外乎营销场景需求明确、效果可量化、付费意愿强,在他看来,这里最能体现 AI 的真实价值。

而选择做 Agent 是因为它面向更广泛的用户群。

一个优秀的 Agent 可以像专业 Agency 一样理解雇主(也就是用户)诉求,从创意策划、脚本生成到视频成片,全流程自动完成,用户只需要输入品牌信息和风格需求。

做一个 Agent,就像是给用户打造的一个全年无休的 "007" 乙方。

"Agent 使用起来无需学习技能、交互极简,像人与人之间的交流方式。即便只有模糊的想法……甚至不确定自己想要什么,Agent 都能理解并生成内容。" 廖谦进一步解释道," 而且 Agent 以用户的结果为中心。我们告诉用户一个明确的价格和可达到的质量标准,让他来判断是否符合预期,从商业模式上来看,这更理想也更友好。"

他把这种模式称为 " 预期思维 " 或 " 结果导向 "。

做 AI 工具,需要让用户学习功能、写提示词;做 Agent,则需要 Agent 反过来理解人。

——好的产品一定会持续降低用户的各种成本,无论是使用成本(不需要学习和反复试错)、理解成本(用户能一眼明白得到什么)还是价格成本(花得明白、物有所值)。

当 " 为什么做 Agent" 的原因清晰后,极致上下文的用户主力画像就呼之欲出了, " 我们的用户,是那些大概知道自己要什么,但不需要懂怎么做的人 "。

廖谦表示,在产品路径上,极致上下文会先聚焦于营销场景下的 AI Video Agent," 帮助品牌更好地做视觉化表达,提供从创意、脚本到视频生成、编辑的端到端能力 "。

在中长期规划上,则是想搭建一个 AI 时代的信息表达系统,让任何人都能实现个性化自我表达的平台。

早期谷歌时期是搜索时代,人找信息;过去十年移动互联网是推荐分发时代,信息找人。

现在,大模型让 " 信息的表达 " 变得前所未有地容易,AI 正在让 " 表达 " 这件事重新被定义。生成模型让任何人都能以更自然的方式去表达意图,无论是品牌还是个体,都需要更精准、更个性化的视觉语言。

所以他判断:

下一阶段的核心竞争力,是谁能帮人、帮品牌、帮组织更好地表达自己。

未来,这套系统的能力还可以拓展到教育、生活方式、娱乐等更多领域。

创业的底气从哪里来?

" 我一直知道自己迟早会创业,只是一直在等一个值得真正 All in 的时刻。"

从技术周期上看,今年确实像是个拐点。

语义理解、镜头语言、画面真实度全面提升,Google Veo3 和 Sora 2 等都用实际效果隐隐告诉行业,技术已经进入 " 可用 " 的临界点。

接下来就要看谁能把能力转化成真实的产品价值——廖谦眼中最值得 All in 的时刻,来了。

在过去十年的职业经历中,廖谦几乎完整经历了从算法到产品、从国内到海外、从大厂到创业的完整路径。

他本硕均就读于西安电子科技大学,本科电子信息工程专业,硕士阶段主修计算机视觉。

2015 年硕士毕业后,廖谦进入腾讯天美游戏工作室,参与游戏研发;两年后,他转岗至腾讯云,负责 AI 人脸人体业务,从零起步将这条业务做到国内第一、全球第三。

腾讯工作的 6 年期间,他第一次体会到算法在应用层爆发的能量——当年风靡朋友圈、上线十几天冲到图片类榜单第一的 " 她拍 " 小程序,就由廖谦所在团队来提供人脸融合技术。

2021 年,他加入字节跳动火山引擎,从 0 到 1 打造了 " 智能创作云 "。廖谦表示,这是当时团队流量最高的产品。

两年后,他又在剪映内部孵化出海项目 Pippit。他是当时这个项目的发起人,同时也是平台和商业化的负责人。

Pippit 是一个海外商家的 AI 内容生产与分发平台,目前月活已超过百万。

到了 2024 年年初,Sora 一石激起千层浪,几乎所有的 AI 从业者都在谈论走在东京霓虹灯下的墨镜女郎。廖谦猛然意识到,新的一轮技术周期开始。

趁着这股东风,他离开大厂,选择加入专注多模态基模的创业团队生数科技,开始主导 Vidu 的产品、研发、运营和营销工作,带领超百人团队。

在生数工作的一年时间里,他主导了十余次算法与产品迭代。

而这段经历中最被他看重的创新,是在生数行业首创了 " 参考生视频(Reference to Video)" 功能。

参考生功能的意义在于多模态模型开始具备上下文记忆,它能理解不同主体及其特征,还能参考之前的素材和风格,实现内容的连续性和一致性。

就像 AI 在创作一部长剧,当它生成第十集时,已经理解前九集的风格和逻辑,能保持统一的调性。

(是不是就更能理解他为啥给自己公司起名叫 " 极致上下文 " 了?)

" 这个时代没有传统意义上的护城河 "

" 你们公司的护城河会是什么?"

廖谦沉默了片刻,回答说:" 这个时代没有传统意义上的护城河。"

他提到一个典型例子,Sora 2。它的发布不仅再一次证明了 OpenAI 的野心——不满足于做模型公司,要向产品和平台演进,更重要的是它搅乱了原本的竞争格局。

用更直白的话来说,Sora 2 直接打到了抖音、TikTok、等巨头的腹地,侵蚀了它们的核心业务,迫使它们在核心业务上花大量资源、精力防守。

但对初创公司来说这是个好消息。

巨头互殴,过程中不得不拿出一部分精力自保,这意味着他们在其他方向上的创新会慢下来,创业公司就拥有了进攻窗口期。

当巨头忙着守,你就有机会去攻。

去定义新的内容形态、新的协作方式,甚至新的信息分发逻辑。

不过廖谦还说了,如果一定要说优势,应该是 " 我们对用户和场景的理解,以及团队的热爱 "。

他想了想,表示最近极致上下文团队的大部分同学干劲满满,早上 8 点多就到了,大家每天工作几乎超过 14 个小时。

由于新公司早期业务聚焦 AI Video Agent,还是在和视频生成打交道,我们询问了廖谦关于 AI 视频方面的未来预判。

廖谦判断,在模型层面," 一致性 " 是绝对可预见的提升方向,而且是接下来重点解决的方向。

因为就连头部梯队的 Sora 2 一致性也还不够好。" 大家喜欢用 Sora 2 和奥特曼‘合拍’,里面奥特曼的角色一致性保持得比较好,但用户自己的形象大部分都不够好。"

除了画面之外,音色的一致性可能在未来 3 到 6 个月内基本被解决;画面美学,构图、光影这些要素也都有待提升。

One More Thing

" 前几天和大厂的老同事吃饭,问我创业感受。"

" 我的 Co-founder 的回复特别好——想听真话还是假话?真话就是,工作时长更长了,但反而没有大厂那么累。"

" 创业是一种生活方式,这种感觉是焦虑,也是兴奋。"

" 你知道自己在为一件值得全力以赴的事努力。"

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  年度科技风向标「2025 人工智能年度榜单」评选报名火热进行中!我们正在寻找 AI+ 时代领航者  点击了解详情

❤️‍   企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与   

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 视觉技术 技能 实操 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论