3 月 20 日,2025 年中国家电及消费电子博览会(AWE2025)上,实时互动云服务商声网推出了对话式 AI 开发套件,并宣布该套件软硬件全面开源。
据声网官方介绍,对话式 AI 开发套件基于博通集成(Beken)高性能 AI 芯片 BK7258,结合声网深度优化的对话式 AI 引擎,构建了完整的端侧实时交互系统,可为开发者提供「对话式 AI+ 智能硬件开发」一站式解决方案。
(图源:声网)
在语音活动检测(VAD)、实时语音混合、智能打断处理等技术和方案的加持下,声网对话式 AI 开发套件具备五大优势。
第一,AI 对话体验堪比真人交互。声网对话式 AI 开发套件可实现 AI 与用户对话延迟低至 650ms,打断响应低至 340ms,接近真人聊天对话,再加上精准的语音识别能力,即便在复杂环境下也能准确获取用户指令。
第二,对于多模态交互的支持。声网对话式 AI 开发套件不仅提供丰富的接口支持,还支持文本、视频、触控等多种交互方式,打造出了集听、说、看、触于一体的交互形态,可满足开发者和用户的多样化需求。
第三,兼容主流 AI 大模型。在开源成为主流的今天,开发者已不需要付出高昂成本自研 AI 大模型,接入其他企业开发的 AI 大模型更加省时省力。声网对话式 AI 开发套件兼容通义千问、豆包、DeepSeek 等国内常见 AI 大模型,也可以接入开发者自研大模型,选择更加丰富自由。
第四,可帮助开发者缩短产品开发周期。声网表示,AI 开发套件软硬件全面开源,开发者仅需下载开源代码,就能将 AI 能力集成到自己的硬件设备中,1 小时即可跑通 Demo,1 天完成产品原型送样,从而大幅缩短产品的开发周期,降低产品开发成本。
第五,极低的功耗。声网对话式 AI 开发套件采用低功耗设计方案,可实现超长待机,解决移动便携类产品的续航焦虑,扩大适用范围。
至于使用场景方面,声网提到了 AI 玩具、AI 教育硬件、AI 陪伴设备、家庭语音助手、穿戴设备 - 个人助手等领域。其中 AI 玩具、AI 陪伴设备主打陪伴功能,今年的 CES、AWE 大会均有许多企业展出了陪伴机器人,可见该行业前景巨大,部分企业已抢先入场。
AI 教育硬件、家庭语音助手、穿戴设备 - 个人助手则围绕生活和工作,通过更准确的语音识别和更智能的人机交互,提高生活便捷度与工作效率。
在这些品类中,AI 玩具可能是声网快速发挥作用的主战场。声网透露,2024 年全球 AI 玩具市场规模已达 181 亿美元,预计 2033 年市场规模将达到 600 亿美元。AI 情感陪伴机器人初创公司珞博 Robopoet 此前发布的口袋 AI 毛绒宠物 Fuzzoo,便搭载了声网的对话式 AI 技术,能够为用户提供个性化交互体验。
随着相关供应链的成熟,具身智能正逐步走入我们的生活,但无论是机器人,还是配备了各类传感器的家电设备,提高实用价值的关键就在于可以准确接收用户的语音指令,并通过 AI 大模型解析和执行任务。
声网对话式 AI 开发套件软硬件全面开源,意味着有志于具身智能行业的企业,能够低成本、快速为产品加入 AI 对话能力。该产品可自由接入传感器和大模型的特性,为开发者提供了极高自由度,可以基于声网提供的平台,快速适配自家的硬件设备。
在声网对话式 AI 开发套件全面开源,有望为国内整个具身智能行业进一步提速,AI 玩具、AI 教育硬件、AI 陪伴设备等品类,或将快速成熟并落地量产。
登录后才可以发布评论哦
打开小程序可以发布评论哦