太平洋电脑网 03-21
OpenAI推出新一代语音模型 重点提升复杂环境识别和处理能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】近日,OpenAI 宣布推出一系列创新的语音模型,包括 gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts,这些模型在语音识别和处理方面取得了显著突破。

OpenAI 此次推出的 gpt-4o-mini 模型,以其高性价比和强大功能脱颖而出。该模型在成本上较 GPT-4o 降低了 96% 至 97%,同时比 GPT-3.5 Turbo 便宜 60% 至 70%。据悉,gpt-4o-mini 的 API 价格定为 15 美分 /100 万 Tokens 输入和 60 美分 /100 万 Tokens 输出,为开发者提供了更为经济实惠的选择。

GPT-4o 模型具备处理 50 种不同语言的能力,大大提高了语音识别的适用范围。此外,该模型在响应速度和质量上均有显著提升,能在最短 232 毫秒内对音频输入做出反应,接近人类对话反应时间。GPT-4o 还能读取人的情绪,使得人机交互更加自然和流畅。

新推出的语音模型在语音转文本 ( STT ) 方面表现出色,尤其在口音适应、嘈杂环境处理以及不同语速识别方面优于现有解决方案。这使得模型在呼叫中心、会议记录等场景中更具实用性。同时,文本转语音 ( TTS ) 模型允许开发者设定语音风格,如模拟富有同理心的客户服务代表,提供更具表现力和温度的语音体验。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

脱颖而出 语音识别
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论