商业财经网 08-06
Soul张璐团队全面升级全双工语音通话大模型,重构AI社交
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在 AI 深度融入生活、重塑链接的当下,社交场景的底层能力创新成为提升交互体验的关键。Soul 张璐凭借对行业趋势的敏锐洞察,早早将 AI 技术融入 Soul App 的发展战略,带领团队在 AI 领域持续深耕,致力于为用户打造充满情感温度的社交体验。近日,Soul App 宣布其自研的端到端全双工语音通话大模型完成全面升级,重新定义了 " 全双工 " 交互范式,为 AI 社交带来了突破性的进展。

此次升级的核心,是摒弃传统语音交互依赖的 VAD 机制与延迟控制逻辑,打破 " 轮次对话 " 模式,赋予 AI 自主决策对话节奏的能力。这一变革使得 AI 能够实现主动打破沉默、适时打断用户、边听边说、时间语义感知、并行发言讨论等功能。同时,模型具备多维度感知功能,包括时间感知、环境感知、事件感知等,还能实现口语化表达,如自然运用语气词、出现结巴或明显情绪起伏,深知具备音色复刻等能力,让 AI 在交互中更具 " 真人感 ",为用户打造出更为沉浸、类现实的语音互动新体验。

从行业情况来看,此前 AI 陪伴类产品受限于技术,普遍存在 " 一问一答 " 的机械感,延迟与打断问题严重影响沉浸度。2024 年,在 Soul 张璐及团队的共同努力下,Soul 推出端到端全双工语音通话大模型。今年,Soul 再次升级模型,则进一步强化——在交互自主性上,AI 可自主决定说话时机,甚至支持辩论、合唱等并行对话;在表达自然度上,融入结巴、口头禅等细节,情绪随对话动态变化;在场景适配性上,通过统一文本与音频生成的模型架构,整合人设、环境、上下文等信息,塑造连贯 " 数字人格 "。

应用层面,新模型即将开启站内内测,将率先落地于虚拟人实时通话、AI 匹配等 1V1 场景,同时团队正探索多人场景适配,让 AI 在多人语音对话中精准把握时机、延展话题。这一技术升级回应了用户核心需求:Soul 调研显示,71.1% 的 Z 世代愿与 AI 建立情感链接,约六成用户期待 AI 更接近真人表现,而全双工能力正是实现这一诉求的积累之一。

作为深耕 AI 社交的平台,Soul 自 2016 年上线后便积极拥抱 AI,致力于构建更智能、沉浸的交互体验。此次全双工模型升级,不仅是技术迭代,更标志着 AI 从工具性陪伴向情感性交互的跨越,为构建 AI 与人共存的社交社区奠定了基础,持续践行 " 让天下没有孤独的人 " 的愿景。在 Soul 张璐的带领下,Soul App 将持续技术创新,在 AI 社交领域开拓出更广阔的发展空间,为用户带来更多超乎想象的交互体验。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai soul 张璐 技术创新 语音交互
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论