问题还没说完,就被 AI 抢答是一种什么体验?被 AI 的 " 活人感 " 震撼到一度怀疑究竟和自己对话的是真人还是机器人又是什么感受?近日,在上海举办的 WAIC 2025 上,笔者就看到了 Soul App 情绪价值赋能方向等诸多智能体应用落地的场景,也看到了现场观众讨论 AI 的热情。
" 下一轮的 AI,卖的不是工具,而是收益。" 这句话已经成为行业共识,生成式 AI 的赛道也正在从 " 如何制造更多工具 " 向着 " 如何产生更多价值 " 的方向发展。当技术转化为更多普通个体愿意为之买单的实际体验,才能催生 AI 时代的 Killer App,而这届 WAIC 大会提供了一种方向。
AI 步入新时代,从工具到创造价值
AI 不再是卖工具,而是创造价值已经是当下 AI 发展的重要趋势,这点从近日举办的 WAIC 上就能 " 可见一斑 "。与去年绝大多数应用场景仍处于炒概念不同的是,今年 WAIC 期间,各个参展商都带来已经成熟落地的应用,这些应用有一些是在原先软件服务基础上,AI 化之后提供的 " 解决方案的智能化 ",有一些则是基于 AI 开发的,AI 原生的 " 智能化的解决方案 ",但它们相较于去年,都有了不少实际落地的经验与成果展示。
比如,在大会期间,在中信集团展台上,华智生物展示了融合 AI 图像识别与深度学习技术的智能考种分析仪,解决了传统依赖皮带传动与风选模式识别空头稻穗存在的误判率高、数据离散等痛点。
AI 智能体创造价值的场景不仅局限于农业领域,围绕医疗、工业、金融、交通等领域,也有不少厂商在本届 WAIC 上带来了全新的,结合了智能体的应用场景。
除了传统面向 B 端的企业级 AI 应用之外,在 C 端,AI 在面向终端用户方面也有了不少成熟的应用落地。比如在 Soul 连续多年参加 WAIC 的主题中,可以看到其 "AI+ 社交 " 的发展路线,今年,Soul 更是在原有 AI 功能的基础上,在底层技术和应用方面升级,带来了全双工实时语音通话大模型,以及全新的 AI 社区应用成果。
AI+ 社交,为什么 " 活人感 " 很重要
根据关注年轻人趋势的 Just So Soul 研究院 2025 年上半年调研数据,超过 80% 的年轻用户正借助 AI 建立起真实的人际关系。其中,39.9% 从 AI 获得了话题建议和情感咨询 / 支持,43.6% 凭借 AI 生成答复成功社交破冰,37.7% 在 AI 帮助下匹配到了志趣相投的好友。
观察 Soul 的技术发展路线,其人机互动的迭代方向便是让 AI 实现类真人能力,在交互中为用户带来情绪价值和信息价值,提升个体体验,并促进现实关系发展。
一方面,快速的生活节奏催生了个体的 " 原子化 " 趋势和现实社交困境;另一方面,AI 技术的升级进一步赋能链接并重塑大众对人机互动的认知。
据了解,过去一年,Soul 的 AI 能力有了较大的迭代,特别是在 2024 年,Soul AI 大模型能力整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。
" 目前,Soul 的关系模型灵犀能够推荐‘精神层面距离最近的灵魂’,情绪模型 Soul X 能够精准捕捉如孤独感、安全感等用户情感需求,通过 AI 向用户提供长期的情绪价值。" 在 WAIC 现场,Soul App 副总裁及市场负责人范莉这样介绍道。
值得注意的是,在 AI 技术不断演进的过程中,Soul 在过去一段时间重点布局了 " 全双工 " 方向,打破目前行业中语音交互普遍的 " 一来一往 " 形式,让 AI 自主决定说话时机。
笔者在 WAIC 现场感受了一下全双工语音大模型的效果。传统的半双工的一问一答,且中间还需要 AI 反应回馈的等待时间。但在全双工的模式下,用户与 AI 的交互是同步的,AI 甚至会打断对话者的通话并基于这段对话反馈。比如在笔者体验过程中,面对笔者提出的 " 你是哪里人?" 的问题,当笔者 " 话音未落 ",AI 就开始回答,并主动向笔者介绍了当地的特色。
(WAIC 2025 Soul App 展台体验现场)
值得注意的是,全双工语音大模型发音方面与真人 " 难辨真假 ",在现场体验环节,笔者仅通过听声音并不能准确地辨别对话中两个声音哪个是真人,在工作人员的告知下才得知真相。除此之外,该模型还能模仿各个地区的方言。与传统的语音模型声音过于机器化相比,全双工大模型能带给用户更加真实的体验,带来 " 活人感 " 的互动。
当然,在技术探索的过程中,Soul 也遇见了不小的挑战,其中,打破行业中普遍存在的 " 轮次对话 " 模式,赋予 AI 自主决策对话节奏的能力就是一个不小的挑战。
例如,Soul 通过让模型基于建模预测沉默(Silence)和响应(Response)Token 预测任务,实现机器人的完全自主决策能力,精准控制对话节奏中的沉默与发声时机,"Soul 的方法让 AI 自己‘琢磨’什么时候该沉默(等着听你说),什么时候该开口回应你,就像真人对话一样,它自己掌控节奏,时机更准。"Soul App AI 技术负责人尹顺顺表示。
以持续的技术能力建设为基础,Soul 希望围绕用户实际的社交需求,深入推进 AIGC 技术与社交场景的深度融合,在‘模应一体’方向下,为用户带来更沉浸、更智能、更深度的社交体验。
而看好全双工语音大模型的不仅是 Soul 一家,还有很多国内外的厂商都围绕全双工大模型展开了布局。
以谷歌为例,在 Google I/O 2025 大会上,谷歌就对 Gemini Live API 进行了全新升级,除了更加细致的情感理解和双人语音合成,更吸引人注意的便是 " 主动音频 " 和 " 主动视频 " 功能。以主动音频为例,谷歌 Gemini 模型展现的能力,就与 Soul 推出的全双工语音大模型能力类似。具体来看,主动音频功能中,模型将忽略背景对话并知道何时回应。demo 演示中,Gemini 会主动忽略人类对话里一些类似 "ok" 这样的背景声音,持续说话。
在接受媒体访谈时,Google DeepMind 研究主管 Greg Wayne 也曾表示,谷歌在全双工音频输出方面加大了研发力度," 它可以同时处理听和说,这可能会有点烦人。它可能会打断你。但它也更像自然的对话。当你说话时,我可能会说,‘嗯嗯’、‘嗯嗯’,它在同时听和说。这是用来确认的语言的一部分。"Greg Wayne 指出。
由 Soul 和谷歌的业务布局不难看出,基于人类对更为真实的交互感受的向往,AI 若想真正要在社交中体现价值,具备更强的 " 活人感 " 和 " 主动性 ",是必不可少的能力。
从 "AI" 到 " 爱 ",在应用中展现价值
全双工语音大模型的探索外,本届 WAIC 上,Soul 还展示一些 " 不一样 " 的尝试——让 AI 真正融入到个体的社交网络之中,让社交变得更简单。
具体来看,Soul 在此次 WAIC 展会上展示的新能力落地在 Soul 平台应用场景——群聊派对 AI 主持的真实交互体验。依托新能力,在多人语音互动场景中,AI 主持人不仅具备全面管理群聊派对秩序的类真人主持的操作能力,还能够自然进行语音互动,有效活跃气氛、鼓励用户参与对话讨论,显著提升群聊派对的参与度和体验感。
可以想象一下,在年轻人具体使用场景中,如当求职季到来,大家可以在 AI 面试官的组织下,举办 " 模拟群面 ",感受真实招聘场景下可能遇到的提问、集体问答、抢答等现实环节;而在相亲场景中,大家可以在 AI 红娘的主持中,自然破冰、相识,一起进行趣味互动。
(现场体验与虚拟人视频通话)
不仅于此,现场笔者还体验到了 Soul 还在探索全双工视频通话能力的探索,和虚拟人 " 实时视频 " 过程中,基于实时的视频生成能力和全双工语音交互能力,在实际交互体验中,可以看到 "AI 的形象和世界 ",人机交互真正成为了 " 情感与信息的双向交流 "。
随着 AI 技术从大模型向智能体演进进程的深入,社交智能体也是 Soul 布局的重点。社交智能体需要非常多维和复杂的能力组合,其中包括了交互能力(例如自然语言理解与生成、全双工语音 / 视频通话、多模态感知 / 表达)、认知与情感能力(例如情感识别、长记忆、心智理论能力)、社会性构建(人设一致性、时间 / 事件感知能力)、风控安全体系等等。
而 Soul 在社交领域的深入布局,也让其在技术与行业 Know How 上具备了先发优势。上线于 2016 年,多年的积累和长期与用户对接的过程,已经让 Soul 在社交软件领域具备了充足的行业 Know How。
在技术方面,Soul 于 2020 年就开启了 AIGC 的研发工作,并在智能对话、语音、3D 虚拟人等方面拥有前沿积累。自 2023 年推出自研语言大模型 Soul X 后,Soul 还陆续上线了语音生成大模型、语音通话大模型、音乐生成大模型等语音大模型能力。
目前,Soul AI 大模型能力已整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性,能够实现更接近生活日常的交互对话和 " 类真人 " 的情感陪伴体验。这些都是 Soul 在社交智能体的构建中积累的前沿能力,例如此次的全双工语音通话大模型的发布,便能够极大提升了社交智能体的交互能力,此外在多模态交互、认知与情感能力、社会性构建、AI 安全等 Soul 都有探索和布局。
除了技术上的探索之外,在社区生态运营上,Soul 也有着自己独特的见解。据 Soul 统计,平台 " 广场 " 上有高达 18% 的新发帖直接反映了用户的真实社交困境(如人际关系处理、社交开启话题、职场交友),而用户分享的生活、情感内容及其引发的深度共鸣,构成了宝贵的 " 社交样本库 "。Soul App 副总裁及市场负责人范莉介绍道,Soul 正在深化 AI 与社区的融合,具体包括了多维度的举措。
例如,利用 AI 的能力,可以重塑社交内容和互动方式,通过大模型,根据用户兴趣和历史数据,智能推荐主题,并辅助生成内容,降低了用户表达门槛的同时,还能实现个性化内容的产出。
同时,打造由虚拟达人组成的 Agent 生态,构建社交情感的 " 附近 "。不同人设的虚拟达人,能从海量信息中识别真实的孤独信号,并以细腻、温暖的互动提供即时情感支持和共鸣。
最终,通过 " 可共创、可互动 " 的虚拟人与真人社交的深度融合,Soul 希望推动社交向 " 情感共生 " 进化,助力构建新世代的数字身份认同体系。
正如前文提到的:Just So Soul 研究院 2025 年上半年调研数据显示,超过 80% 的年轻用户正借助 AI 建立起真实的人际关系,此外,超过 70% 的年轻人愿意和 AI 交朋友,这显示出了 Z 世代的年轻人对于人机关系新的理解。而在情绪价值的交互中,也将催生新市场,《情绪消费崛起:2025 年市场格局与未来走向》显示,中国情绪消费市场规模预计到 2025 年将突破 2 万亿元。AI 作为关键变量,也将在与社交方向融合过程中,延展出新的产品范式和商业机会。
对于社交类 APP 而言,在 AI 时代谁能提供更为真实的交互感受,以及更多的情绪价值,谁就能占有更多的年轻人市场,而在这点上显然 Soul 已经走在了前列。
登录后才可以发布评论哦
打开小程序可以发布评论哦