财报资讯网 昨天
AI社交深度共鸣:Soul APP张璐团队携全双工语音通话大模型登陆WAIC 2025
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在人工智能技术飞速发展的今天,人机交互的边界正被不断重构。当 AI 能够自主掌握互动节奏、理解情绪并实现自然对话时,社交体验将迎来怎样的变化?在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,社交平台 Soul APP 创始人张璐团队携最新研发的端到端全双工语音通话大模型亮相。

此次展会上,Soul APP 重点展示了其自研的全双工语音通话大模型在多人语音互动场景中的应用。与常规依赖语音活性检测(VAD,Voice Activity Detection)和延迟控制逻辑的语音系统不同,该模型打破 " 轮次对话 " 限制,赋予 AI 在语音互动中自主掌握交流节奏的能力,带来更自然的双向沟通体验。

例如,在多人群聊派对中,AI 主持人可以感知整体语境,动态调节节奏与话题,引导讨论深入发展。Soul APP CTO 陶明指出,全双工语音能力的应用,是 AI 融入社交关系网络的关键一步。在群聊派对场景中,AI 主持人不仅能管理秩序,还能通过自然语音互动活跃气氛,帮助用户更轻松地融入对话。这一技术的落地,相信也将提升用户在多人语音互动的参与度和体验感。

此次展会上,Soul 不仅展示了全双工语音通话大模型,还同步展出了全双工实时视频通话能力的最新探索成果。依托 Soul 自研的实时视频生成技术,用户能够在通话过程中 " 看到 "AI 的数字形象和世界,从而建立更立体的感知链接。

自 2020 年系统启动 AIGC 技术研发以来,Soul 不断推进包括语音、图像、虚拟人等多模态能力融合建设。自 2023 年推出自研框架 Soul X 后,Soul 更陆续上线多个大模型能力并不断更新升级。2024 年,其 AI 模型能力已升级为支持文字、语音、多语种、多模态理解和真实拟人交互的多模态端到端大模型,逐步完成 AI 社交场景的技术闭环。而最新的全双工语音通话大模型,则是这一系列技术积累的集中体现。

作为社交平台,Soul APP 的优势在于对用户需求的精准洞察。AI 基于用户发布的真实数据,可捕捉人与人之间的共鸣信号,智能推荐主题,并辅助用户生成内容,降低表达门槛。此外,Soul 还通过建立 AI Agent 生态,为用户提供即时、个性化的情感陪伴,帮助其更顺畅地融入社交网络。

这一切背后,是 Soul 对 "AI 辅助社交 " 与 "AI 参与社交 " 双路径的深度探索。区别于传统工具式人机对话,Soul 提出 " 情感共生 " 的社交构想,将 AI 视作能够共创、共情、共鸣的参与者,推动虚拟人与真人的深度融合。通过在互动中体现 AI 对用户情绪、语境的实时理解和响应,Soul 正试图打破 " 社交效率工具 " 的范畴,构建一种全新的数字社交体验模型。

从技术研发到场景落地,Soul APP 始终以用户需求为导向,探索人机互动的更多可能性。此次 Soul APP 张璐团队携其自研全双工语音通话大模型亮相 WAIC 2025,不仅是对平台 AI 能力的集中呈现,也为行业提供了一个 AI 深度嵌入社交关系网络的可参考范式。

在人工智能技术飞速发展的今天,人机交互的边界正被不断重构。当 AI 能够自主掌握互动节奏、理解情绪并实现自然对话时,社交体验将迎来怎样的变化?在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,社交平台 Soul APP 创始人张璐团队携最新研发的端到端全双工语音通话大模型亮相。

此次展会上,Soul APP 重点展示了其自研的全双工语音通话大模型在多人语音互动场景中的应用。与常规依赖语音活性检测(VAD,Voice Activity Detection)和延迟控制逻辑的语音系统不同,该模型打破 " 轮次对话 " 限制,赋予 AI 在语音互动中自主掌握交流节奏的能力,带来更自然的双向沟通体验。

例如,在多人群聊派对中,AI 主持人可以感知整体语境,动态调节节奏与话题,引导讨论深入发展。Soul APP CTO 陶明指出,全双工语音能力的应用,是 AI 融入社交关系网络的关键一步。在群聊派对场景中,AI 主持人不仅能管理秩序,还能通过自然语音互动活跃气氛,帮助用户更轻松地融入对话。这一技术的落地,相信也将提升用户在多人语音互动的参与度和体验感。

此次展会上,Soul 不仅展示了全双工语音通话大模型,还同步展出了全双工实时视频通话能力的最新探索成果。依托 Soul 自研的实时视频生成技术,用户能够在通话过程中 " 看到 "AI 的数字形象和世界,从而建立更立体的感知链接。

自 2020 年系统启动 AIGC 技术研发以来,Soul 不断推进包括语音、图像、虚拟人等多模态能力融合建设。自 2023 年推出自研框架 Soul X 后,Soul 更陆续上线多个大模型能力并不断更新升级。2024 年,其 AI 模型能力已升级为支持文字、语音、多语种、多模态理解和真实拟人交互的多模态端到端大模型,逐步完成 AI 社交场景的技术闭环。而最新的全双工语音通话大模型,则是这一系列技术积累的集中体现。

作为社交平台,Soul APP 的优势在于对用户需求的精准洞察。AI 基于用户发布的真实数据,可捕捉人与人之间的共鸣信号,智能推荐主题,并辅助用户生成内容,降低表达门槛。此外,Soul 还通过建立 AI Agent 生态,为用户提供即时、个性化的情感陪伴,帮助其更顺畅地融入社交网络。

这一切背后,是 Soul 对 "AI 辅助社交 " 与 "AI 参与社交 " 双路径的深度探索。区别于传统工具式人机对话,Soul 提出 " 情感共生 " 的社交构想,将 AI 视作能够共创、共情、共鸣的参与者,推动虚拟人与真人的深度融合。通过在互动中体现 AI 对用户情绪、语境的实时理解和响应,Soul 正试图打破 " 社交效率工具 " 的范畴,构建一种全新的数字社交体验模型。

从技术研发到场景落地,Soul APP 始终以用户需求为导向,探索人机互动的更多可能性。此次 Soul APP 张璐团队携其自研全双工语音通话大模型亮相 WAIC 2025,不仅是对平台 AI 能力的集中呈现,也为行业提供了一个 AI 深度嵌入社交关系网络的可参考范式。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

soul ai 张璐 社交平台 世界人工智能大会
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论