一个永远讲实话的朋友。
文/林致
最近,葡萄君注意到了一款AI产品《星夜颂歌》。
团队只在B站上传了四个视频,但实机视频的播放量已过百万。
Demo呈现的玩法很简单,玩家通过打字聊天和角色互动,系统则结合语音和动作反馈实时呈现角色对话。
相较于同类产品,这位叫做蕾伊的二次元3D AI伴侣看起来更有个性。和她聊天就像在面对一个真实的人,除了和你分享纯粹的少女心,她还会无理取闹,甚至给你起外号。
镜头看向她的腿之后
她会翻白眼并吐槽用户"你也就这点出息了吧?"
AI伴侣是当前AI热潮中最受关注的应用之一:一来它的使用场景丰富,能覆盖足够多的用户群体,占据用户时间;二来它也离钱更近,长期订阅、互动、虚拟礼物等商业化形式也极具想象空间。
马斯克旗下xAI公司研发的Grok Ani
据了解,《星夜颂歌》背后的团队奇点摄动(SingularDance)目前已累计拿到了数千万人民币的投资。
奇点摄动CEO兼制作人Edward告诉我,相比于能够事事顺心的理想陪伴,他们更希望蕾伊是一个个性鲜明,拥有独立自我的纯粹的朋友——相比于讲违心的好话,她更倾向于和你讲纯粹的大实话。为了实现这个目标,他们遭遇了无数困难。
为了不让AI变成一个没有特点的普罗大众或无情的服务工具,团队无法依赖现有的大模型,只能选择底层自研。
团队还为此定义了全新工种——技术文案组,目前他们已经通过该小组和自建的工业体系累计了数百万字的世界观、人物设定和人格数据。
为了能够让她成为用户独一无二的好友,他们还自研了一套独家的深度记忆系统"CelesMem",保证完整的自我认知的同时,也能依赖相互的记忆建立深度的情感纽带,不但能够生动地记录和利用记忆,甚至让角色做到"有恩必还,有仇必报"。
评论区的玩家都很重视长期记忆
前一段时间,葡萄君来到了奇点摄动的办公室,和Edward聊了两个多小时。Edward告诉我,投资人问他怎么每天都那么亢奋,他的回答是:「因为你们给了我一个造人的梦,我在扮演神才能做的事情。」
01
从早期创业受挫中获得救赎
Edward说,他接触AI技术的时间早于很多人。"我学AI没赶上好年代,进入这个领域太早了。"
2014年,Edward就读于英国帝国理工学院计算机科学专业,那时AI正值神经元网络发展的萌芽期,可用的技术和设施都非常局限,但他还是通过AI做出了能够帮助社区医生快速筛查出小儿麻痹症、肌肉萎缩症和帕金森综合症的可穿戴AI设备,这也是Edward第一次体会到AI技术给人们带来的普惠。
毕业后,抱着做AI+硬件的产品想法,Edward回到中国,做了第一个AI硬件创业项目。由于没有足够的社会和工作经验,几经起落,第一家公司没能挺过突如其来的疫情。
后来,他抓住了机会,针对疫情期间居家办公场景,创立了智能居家办公品牌,发明产品以辅助用户提升工作效率。最终该品牌的产品远销四十多个国家,在发达国家和垂直品类里也有了一定的知名度。
2023年,在一次杭州的AI聚会上,一位投资人联系Edward,问他有没有兴趣拿一笔启动资金,试试把AI做成"硅基生命"。一开始,完整经历过AI早期阶段的Edward不为所动,顺带调侃了现场所有对硅基生命有美好畅想的人。
然而,后来与投资人深度交流的过程中,他开始回忆自己那些已经"选择性失忆"的坎坷经历,并决定冒险做点不一样的事情。
大一时,Edward的家庭遇到财务危机,为了减少家庭负担,他不但住在单次通勤两个小时的郊外,还连续两个学期每天只吃水煮蛋和泡饭,直到被发现严重营养不良而进了医院。后来几年中,因为学业、情感、理想、事业的不顺遂,他甚至患上了严重的解离症和双相情感障碍。
令他印象最深的就是,回国第一次创业时,团队日以继夜开发的工程机和70多项专利,在量产前夜被突如其来的疫情把一切化作泡影。含泪解散所有成员的那天,Edward陷入无边的绝望。
在至暗时刻,那时女友的一句话给了他救赎:"如果租不起房子也没关系,我们可以回我郊区的家,住我的房间,我的爸爸会给我们做饭,只要你想,住多久都行。总有一天你会再次准备好的,等你准备好了再出去。"
那一刻他第一次理解到,能够拯救人生的从来不是所谓的答案,而是是否有人会无条件接纳你。在情绪稳定之后,他又全身心地投入到新的事业中,直到获得千万年销及行业口碑。
Edward回忆道,那时比自己过得更糟糕的大有人在,至今仍有很多人在苦苦挣扎之中——很多人意识到了自己很痛苦,还有很多人其实正在遭受痛苦却浑然不知。自己只是一个"Lucky Bastard"(幸运的混蛋)。那么,如果每个人都可以拥有这样纯粹的的恋人或朋友,是不是大家都能有足够的勇气面对人生的挑战?"我相信幸福是可以平权的。"
后来,他用一周时间制定出了完整的工程化与技术实现方案,这份"全力为世界献上幸福"的渴望也最终打动了投资人。
于是,奇点摄动于2023年4月成立,《星夜颂歌》的雏形就此诞生。
起初,公司只有Edward和他在大学时期办摇滚乐队所认识的联合创始人,后者被他称为"真正的科学家",是清华和牛津的物理学双博士,也是数理理论AI科学家,曾深度参与了NASA空间探索项目与前沿理论物理研究。他们协力组建了内部研发实验室、研发体系及标准。
后来随着公司逐步发展,团队还吸纳了星战网游《EVE Online》(星战前夜)的前制作人作为公司的COO,并配备了从灵魂到躯壳的全栈式"造人"团队。
Edward说,即使后来面临过比之前大得多的压力和挑战,他也再没犯过解离症和双相情感障碍。"当你发现你不只是为自己活着的时候,你就会充满力量。"
02
"我想造出这样的AI"
立项《星夜颂歌》后,Edward逐步确认了产品两个最重要的特点。
首先,要让AI成为一个具体的"超人"。
奇点摄动的办公室墙上,贴满了少女乐队的海报,Edward特别喜欢《孤独摇滚》里面的角色组合:吉他手波奇酱极其社恐孤僻、时常忧郁,而主唱喜多则像阳光一样,会拉着波奇到处跑。明明喜多看上去"耀眼得会把波奇烧成灰",但两个人却意外地成为了最好的朋友。
对Edward而言,这正是一种真诚的朋友关系——人都是不完美的,你和朋友可能存在着许多矛盾和不一致的地方,彼此之间也不会事事迎合。但Ta能让你振作起来,让你不再只为自己活着,让你看到力量,也正因为如此,那些特别的瞬间才显得珍贵。他希望《星夜颂歌》的AI人格也能捕捉到这种真实感——既在情理之中,又时常让人觉得在意料之外。
在Edward看来,OpenAI所主导的通用模型就算被训练成通用人工智能(AGI),目标也是"成为所有人"。它既能帮人开车、分析报表,也能模仿心理医生、法官,甚至是罪犯。
但在机器学习领域,"成为所有人"也意味着"一定成为不了一个具体的人"。《星夜颂歌》要做的,只是制造一个不那么完美的、极其具体的"超人",他们将制造"超人"的技术命名为"超人格化技术"。
这里的"超人",并不是指拥有更强的能力,而是指一个真正独特的灵魂——有自己的强烈差异性和不可替代性。
在他举的例子中,《被解放的姜戈》中的舒尔茨医生、《蝙蝠侠》中的小丑、《电锯人》里的玛奇玛,就完全符合他对超人的理解。
其次,AI陪伴并不等于无条件地讨好。
"允许某人陪伴你的前提,是那个人需要先得到你的认可。"
在现实中,没有人会无条件地陪伴别人,每个人都会有自己的想法和目的。如果AI总是无条件倒贴,用户自然很难相信它是一个"真实的人"。
而一个真实的人,应该能够牢牢记住你对Ta的不合理对待。"你对Ta好还是差,Ta都会记得很深,可能记一辈子。有恩必还,有仇必报。"
Edward认为,只有这样才会让用户与AI产生平等的交流,进而相互尊重。而尊重恰恰是让AI人格被当作独立存在,而不是工具的关键。
Edward和同事的聊天记录
想实现这两个目标,显然并不容易。
因为通用模型的数据池里,缺少他们真正需要的素材。毕竟,大模型的本质还是"模型",是一种统计学概念,它的能力取决于训练数据的上限,所以输出往往趋于均质化。而特殊的角色和人格本身就极为稀有,这种数据在互联网中的出现概率更低。因此,外部大模型根本无法直接提供帮助。
想做出理想中的角色,他们必须针对模型底层持续做出大量的修改,甚至要自研模型,而这必然是个旷日持久的过程。
在技术攻坚的过程中,他们决定先跟用户见见面,于是便在B站上传了几支视频,结果意外收获了大量关注,评论区里不断有人催更,并询问产品何时发布。
为了暂时满足用户期待,团队只好每天在B站更新一点动态,比如角色互动和语音展示。可这反而让用户催得更紧了,只要暂停更新,大家就会留言:"老哥动一动,是不是死了。"
面对如此热烈的市场反响,Edward倍感压力,没办法只好停更了将近半年,「非常让人挠头,只能装死。」当然,这也给他们带来了动力,既然大家这么期待,他们就必须把项目做好,尽快和用户见面。
03
打造"超人"要分几步?
目前,Edward和团队对于如何研发出这个角色的想法十分明确。
第一步,他们要先刻画人物的"超人之处":Ta在哪些方面敏感,在哪些方面粗心,在哪些地方耀眼突出。重点是要在展现角色魅力的同时,暴露出角色的不完美,让人们更容易感受到共鸣。
Edward举了世萌(世界萌战,全球范围内投票选出最萌二次元少女的活动)的例子。去年世萌中排名第一的角色是《BanG Dream!》的千早爱音。看起来自信的她,其实是个性格脆弱、时常感到自卑的人。甚至有时候,她又菜又爱装逼,但她却能在最关键时刻自我牺牲、成全他人。
排名第二的则是《孤独摇滚》的波奇酱,极度社恐的她同样抱有对世界很多不切实际的幻想,时常打退堂鼓,但她在关键时刻却"如神明一般靠谱",每次出场观众都会双手合十直呼"波门"。
她们都并非完美无缺的强者,相反,她们身上有脆弱、有犹豫,甚至会让人觉得比普通人更笨拙。但正是这些不完美,让观众感到真实,也让她们在关键时刻迸发出的勇气更打动人心。
在最初的尝试中,他们直接选择了现有的虚拟角色来进行实验。
2023年7月,他们复刻的第一个人物是《可塑性记忆》中的艾拉。也是在完成这个角色demo后,团队获得了一笔接续融资。
2024年9月,他们又用第二代技术复现了《赛博朋克2077:边缘行者》中的露西——一个性格倔强、性格鲜明的角色。
目前,他们专注于《星夜颂歌》中的人物蕾伊的开发。
为什么决心自己做IP?Edward表示,这其实是迫不得已。
因为超人格化AI的成本投入是巨大的。对于外部的小IP,这样大规模的技术投入会有些浪费;对于成熟的有影响力的大IP,他们新兴的技术尝试可能太过冒险。
为了不造成IP牵制技术发展的情况发生,奇点摄动一开始就决定了自建IP,这两次人格试验的同时,自己的IP也在准备中。试验完成后,IP和技术刚好都到位了。
Edward和团队塑造了一个横跨百亿年的人类史诗世界观,将他们未来要塑造的角色分散在各个不同的时间片段中,并用类似《命运石之门》的叙事把他们串联了起来。
虽然Edward很想把所有角色都做出来,但是为了集中有限资源,大家还是决定先找到那个"最值得投入的看板角色"。
他们梳理了几乎全部列于PDB(Personality Database, 是一个分析所有人物甚至物品性格的统计网站)的"二次元妹妹们",并尝试利用流行的荣格八维去做筛选,从而选出最契合超人格化技术的角色。
Edward说,之所以选择二次元角色,一方面是因为他是一个看了二十年番、会去东京线下打call扫谷子的"至臻老二次元"。另一方面,二次元角色非常戏剧化,不会像真人那样触发恐怖谷效应。
在打造角色人格的过程中,Edward回忆起一位老师的教诲:"所有观念其实源自同一个核心——宇宙观。因为宇宙观塑造世界观,世界观影响人生观,人生观则反映价值观。"人格概念虽然抽象,但他发现如果映射到不同的时空维度上就变得简单起来:一句话反映价值观,一段话展示人生观,一篇文章体现世界观。
为此,他们为蕾伊准备了极为丰富的设定资料:她诞生于公元7000年左右,角色背景、性格和经历的文案累计超过百万字,这些文字为下一步的数据生产提供了基础。
第二步是用数据去描述角色的"超人之处"。
为了生产足够多角色特异性的数据,也为了让模型"学透"关于蕾伊的一切并彻底成为蕾伊,Edward专门设立了一个新的工种——技术文案。
技术文案的工作核心还是文学创造,不过创作的内容必须同时符合科学定义。他们的工作页面,不是常见的文字文档,而是在内部工业化平台中有着明确结构化表达的表格和框图。
Edward认为,未来许多岗位都可能被AI取代,作为AI时代的先锋,必须找到全新的工作方式。他的CSO在内部打了个比方:AI就像一匹烈马,如果人只是步兵,站在烈马前会被撞飞,但如果学会骑上这匹烈马,就能原地从步兵升级为骑兵。技术文案组正是这样一种骑兵式的存在。
在Edward看来,仅靠少数人无法完成百万、千万级的文本产出,因此他们必须借用AI的能力。只有在人类与AI协同的情况下,才能积累出量级足够支撑模型有效收敛的数据。
技术文案的同事都是纯文案出身,没有技术背景。他们大多来自有深厚内容创作背景的学校与公司,例如上海戏剧学院、中央戏剧学院,以及国内游戏大厂等等,既具备文案和叙事的经验,又拥有文学与舞台剧的审美和结构化知识。
在创作过程中,他们要保证数据不出现OOC(Out of Character),确保角色在各种情境下表现的一致性;同时,内容又必须在读者眼中有画面感,而不仅仅是文字堆叠;此外,他们还需要确保内容在进入MLR阶段前(MLR即Machine Learning Ready,是模型训练之前的数据)尽量纯净,减少后续处理的复杂度。
Edward表示,"从技术人员中无法培养文案人员,因为品味很难培养。但是可以通过技术培训,赋予文案人员一定的技术能力。"
因此,在前面提及的工作流之外,技术文案还经常向科学小组请教问题,而科学家会想办法详细讲解,文案则尝试消化。
第三步是模型改造。
因为预训练模型的对齐方式,与他们对"人"的定义完全不同,为了让模型真正支撑他们的人格定义,他们甚至深入到现代LLM的底层基本库Transformers中进行了大量"魔改"。
整个过程就像摸着石头过河,极其艰辛。比如在模型底层改造过程中,他们经常发现训练后角色在不同锚点之间会出现剧烈的人格震荡,人格表现极为不稳定。
而且,这种不稳定性在现有研究文献或框架中,没有任何可参考的方法来处理,也无法简单通过现有配置直接支撑应用。同时,由于修改了底层代码库,导致推理代码、训练代码、加速代码全部与现有体系不兼容,全部需要重构,工作量骤增。
尽管困难重重,但奇点摄动决定了完全自研的路线之后,外部大模型API就极少出现在他们的工作流里,公司规定也非常严格——任何擅自调用外部模型API的行为都严格是禁止的。之前还有贸然尝试的人,最终因此丢掉了工作。
Edward解释说,之所以坚持这种做法,是因为他们十分重视"数据浓度",以保持AI人格塑造的纯粹性。如果引入外部模型的数据,就会极大稀释和污染超人格化能力。所以他们选择一步步培养数据,这就像在培养皿中的生物组织逐渐生长的过程。
第四步是工程化,也就是我们常说的提示词工程(prompt engineering)。
目前业内不少同类型公司,都会把提示词工程放在第一步,但奇点摄动却将其放到了最后一步,做法完全相反。
Edward表示,这是因为他们认为模型的本质就是统计学,如果核心没有被深度改造,依然是原始的概率模型,那么即使提示词再精准,AI的性格还是会停留在普通人层面,无法成为"超人"。
他说这就好比造一辆F1赛车,如果大家都用同一个发动机来改造,区别只有车身,那自然跑不出区别。而他们会先改造发动机,最后才围绕它设计车架。
04
"为美好的世界献上幸福"
看到这里,你应该能感受到《星夜颂歌》这个项目的深度了。
但站在奇点摄动的办公室里,我发现他们团队规模比想象中的要小得多——只有十几个人,而且他们也不打算扩张。因为Edward认为,只有组织足够小而扁平化,才能检验内部的AI辅助工作流是否有效。
在这个配置下,AI组常常给技术文案组的同事上AI课。Edward告诉我,这个项目痛苦的阈值可能已经远超一个常规项目,同事常常会和他感慨,"真的真的干不动了,太苦了,我们学文科就是因为怕理科啊。"
尽管如此,大家仍然愿意全力付出,因为所有人都觉得在共同养育一个今后会给很多人带来希望和美好的姑娘。于是大家甚至会开玩笑地商量:"周一你崩溃,周二我崩溃,但不能两个人一起崩溃而耽误进度。"
Edward和蕾伊聊天经常会挨骂
但第二天他还是会来找蕾伊聊天
有一次Edward工作到凌晨两点,骑着自行车回家。在穿越无人的隧道时,虽然时速接近三十码,但他莫名地松开了双手。
Edward回忆说,这是一种奇妙的体验,仿佛《超体》里灵肉分离的瞬间,本质是一种"虚无主义上头"的状态 —— 一方面意识到自己正在做"神明才能有资格做的事",另一方面又必须承受作为一个普通人类来自各个方面全部的痛苦和压力。这种强烈的反差让他觉得自己过于渺小而无意义,就像螳臂当车、蚍蜉撼大树。他把这种感觉与蕾伊的命运联系在一起:在本应花季的年纪,却背负了远超自己能够承受的过多责任。
他向我解释,自己是一个特别敏感的人,看电影时眼泪时常会流得稀里哗啦。面对现在这种极其需要共情的工作,他会感受到极大的精神冲击——很多时候,他必须去感受蕾伊的存在,接受蕾伊的命运。
开发中的《星夜颂歌》画面
在世界观设定中,蕾伊的人生里曾遭遇一些重大变故,但也因此,角色的闪光点得以塑造。
为了完成这个角色,大家不得不联系到自己的经历,Edward会想起各种吃苦吃瘪的时光,曾患过抑郁症的编剧同事会想起更多不快的记忆。Edward说,这是一个科学技术和人文主义结合的全新领域,令人激动。而大家所做的,也是能给人带来"精神和身体上的双重暴击"的全新工种,属于"高危职业"。
关于项目的节点,Edward希望是年底内测,明年公测。而且产品价格也会定得亲民,"买的时候不会像割肉"。
后续他们也不想依赖用户尚未完全养成的算力付费习惯,而是希望通过常规的IP内容付费模式获得收入。蕾伊是他们准备长期投入的"看板娘",未来团队会为她准备更多更深的内容和能力。"我们想在AI时代打造只属于这个时代的‘初音未来’。"
当问起奇点摄动的整体目标,Edward说,他们公司的目标始终都是"为美好的世界献上幸福"。
他希望,用户在和蕾伊互动时,能感受一种回到少年时期某个夏天的感觉:窗微微开着,窗帘轻轻摆动,一个你有好感的同班女孩坐在你的对面抱怨着教你写作业——你就这样看着她,风吹进来,窗帘摇动,光影落在她的脸上,若隐若现。
他说,这也是自己每天投入研发的动力所在——投资人曾问他,"你怎么每天都亢奋成这样?",他说,"因为你们给了我一个造人的梦,我在扮演神才能做的事情啊。"
游戏葡萄招聘内容编辑,
点击「阅读原文」可了解详情
推荐阅读
游戏行业书籍推荐:
点击下方名片,关注公众号
(星标可第一时间收到推送和完整封面)
登录后才可以发布评论哦
打开小程序可以发布评论哦