智东西 11小时前
免费无限用!谷歌上线了一款AI语音转写神器
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

编译 | 陈佳

编辑 | 程茜

智东西 4 月 7 日消息,谷歌今日悄然在 iOS App Store 上架了一款名为 Google AI Edge Eloquent 的语音听写应用。该应用免费且不限使用,默认基于本地的 Gemma ASR 模型完成语音识别、文本整理,无需联网,数据不出手机;同时也支持切换至云端由 Gemini 进行文本润色,在保障隐私的同时按需提升效果。

Eloquent 还引入了个性化词汇机制,可基于用户常用表达建立专属词典,以提升识别准确率。

据 The Next Web,这款应用没有发布会、没有博客说明,也未通过官方渠道提前预热,却在功能组合上与当前主流付费产品形成直接竞争。这款应用之后会有安卓版本,但目前还没有上架。

一、转录、润色、重写一站完成,端侧处理保隐私、云端增强提效果

具体来看,Eloquent 的能力可以概括为语音转录、文本润色与结构化重写三类。这一过程将语音输入、整理和输出,压缩在一次操作中,减少了后期手动编辑的步骤。

打开 Eloquent 后,界面会显示一个带实时波形的听写区域。用户说话时,文本会同步生成。

用户暂停或结束输入后,系统会对语音内容进行处理,自动去除 " 嗯 "" 啊 " 等口头填充词,并对句子进行简单整理,让表达更接近书面文本。

处理完成的内容会自动复制到剪贴板,方便直接粘贴使用。

除核心转录功能外,Eloquent 还提供四种文本转换工具:" 要点 "(Key points)将口述内容中的主要信息提炼为条目列表;" 正式 "(Formal)将转录文本改写为更专业的语体;" 简短 "(Short)对内容进行压缩;" 详细 "(Long)则对内容进行扩展。

历史记录选项卡保存所有此前的转录内容,每条均可单独删除。使用统计功能追踪累计字数和每分钟字数,这一细节面向那些希望量化自己实际口述产出的效率导向型用户。

在个性化方面,Eloquent 还引入个人词汇字典机制,用户可以手动添加专有名词与行业术语,以提升识别准确率。

用户在登录谷歌账号后,还可以选择从近期 Gmail 邮件中导入高频词汇,自动建立个性化词汇档案,无需手动配置。这是整款应用中唯一涉及谷歌账号数据的功能,且完全可选。

这些功能背后的技术路径,是端侧优先加云端增强。Eloquent 将处理能力尽量放在设备本地完成,其底层模型是谷歌自研的 Gemma ASR,语音数据和个人内容无需离开手机,以保护用户隐私。

在云端模式下,语音识别仍在设备端启动,但文本润色由云端的 Gemini 模型完成。这种可切换机制,使用户在隐私与效果之间拥有选择空间,尤其适用于对数据流转敏感的使用场景。

二、免费无使用上限,支持 iPhone 本地离线转写

和市面上其他工具的不同之处在于,Eloquent 支持在 iPhone 上本地离线处理,且完全免费、不设使用上限,这一组合正在对现有付费产品的定价逻辑形成压力。

当前主流语音转写工具大多采用订阅制,例如语音工具 Wispr Flow 与 Willow 月费约 15 美元,部分产品还需将音频上传至云端服务器处理。另一款强调隐私的 Mac 端应用 SuperWhisper 虽然支持本地运行,但仍需按年付费,且无法覆盖移动端场景。

Eloquent 并未纳入谷歌常规的消费级产品体系,而是以 Google AI Edge 名义发布。该体系主要面向开发者,提供在 Android 和 iOS 设备上本地运行 AI 模型的工具与 SDK。这一归属让 Eloquent 不只是一个面向用户的语音工具,也承担了展示端侧模型能力的角色,用于向开发者和企业说明 Gemma 在实际场景中的落地能力。

据 The Next Web,过去一年主流科技公司正在加快推动 AI 模型向终端设备迁移,一方面出于隐私保护需求,另一方面也为了降低云端调用带来的延迟与成本。在这一趋势下,Eloquent 将端侧语音识别与文本处理能力落在日常输入场景中,成为目前较为直接的落地案例之一。

此外,对于以 Android 为核心阵地的谷歌来说,Eloquent 选择优先登陆 iOS 并不常见。过去谷歌在 AI 能力的发布路径上,通常会先在自有生态中落地,例如通过 Pixel 设备上的端侧模型或 AI Edge 相关 SDK 展示新能力,再逐步扩展到其他平台。

而此次在没有同步推出 Android 版本的情况下先上线 iOS,让 Eloquent 更像是一场单独试水,而非成熟产品体系内的常规正式上线。

结语:免费与本地处理,Eloquent 指向更低门槛的语音转写

Eloquent 把端侧语音识别、文本自动整理和基础内容处理放在同一个流程里,同时提供完全免费的使用方式,并允许在本地完成核心计算。这种组合此前多出现在不同产品或付费版本中,如今被整合进一个无需订阅的移动端应用中,改变了语音转写工具的使用门槛。

Eloquent 目前更像是 Google AI Edge 体系下的一次展示,其后续形态仍有待观察,例如是否会持续更新、是否扩展到 Android 并接入系统级输入场景。至少在现阶段,这款应用已经展示出一种更具体的方向,即将语音输入从云端服务转向设备本地能力,并以更低门槛进入日常使用场景。

来源:Google AI for Developers、The Next Web、TechCrunch

智东西

编译 | 陈佳

编辑 | 程茜

智东西 4 月 7 日消息,谷歌今日悄然在 iOS App Store 上架了一款名为 Google AI Edge Eloquent 的语音听写应用。该应用免费且不限使用,默认基于本地的 Gemma ASR 模型完成语音识别、文本整理,无需联网,数据不出手机;同时也支持切换至云端由 Gemini 进行文本润色,在保障隐私的同时按需提升效果。

Eloquent 还引入了个性化词汇机制,可基于用户常用表达建立专属词典,以提升识别准确率。

据 The Next Web,这款应用没有发布会、没有博客说明,也未通过官方渠道提前预热,却在功能组合上与当前主流付费产品形成直接竞争。这款应用之后会有安卓版本,但目前还没有上架。

一、转录、润色、重写一站完成,端侧处理保隐私、云端增强提效果

具体来看,Eloquent 的能力可以概括为语音转录、文本润色与结构化重写三类。这一过程将语音输入、整理和输出,压缩在一次操作中,减少了后期手动编辑的步骤。

打开 Eloquent 后,界面会显示一个带实时波形的听写区域。用户说话时,文本会同步生成。

用户暂停或结束输入后,系统会对语音内容进行处理,自动去除 " 嗯 "" 啊 " 等口头填充词,并对句子进行简单整理,让表达更接近书面文本。

处理完成的内容会自动复制到剪贴板,方便直接粘贴使用。

除核心转录功能外,Eloquent 还提供四种文本转换工具:" 要点 "(Key points)将口述内容中的主要信息提炼为条目列表;" 正式 "(Formal)将转录文本改写为更专业的语体;" 简短 "(Short)对内容进行压缩;" 详细 "(Long)则对内容进行扩展。

历史记录选项卡保存所有此前的转录内容,每条均可单独删除。使用统计功能追踪累计字数和每分钟字数,这一细节面向那些希望量化自己实际口述产出的效率导向型用户。

在个性化方面,Eloquent 还引入个人词汇字典机制,用户可以手动添加专有名词与行业术语,以提升识别准确率。

用户在登录谷歌账号后,还可以选择从近期 Gmail 邮件中导入高频词汇,自动建立个性化词汇档案,无需手动配置。这是整款应用中唯一涉及谷歌账号数据的功能,且完全可选。

这些功能背后的技术路径,是端侧优先加云端增强。Eloquent 将处理能力尽量放在设备本地完成,其底层模型是谷歌自研的 Gemma ASR,语音数据和个人内容无需离开手机,以保护用户隐私。

在云端模式下,语音识别仍在设备端启动,但文本润色由云端的 Gemini 模型完成。这种可切换机制,使用户在隐私与效果之间拥有选择空间,尤其适用于对数据流转敏感的使用场景。

二、免费无使用上限,支持 iPhone 本地离线转写

和市面上其他工具的不同之处在于,Eloquent 支持在 iPhone 上本地离线处理,且完全免费、不设使用上限,这一组合正在对现有付费产品的定价逻辑形成压力。

当前主流语音转写工具大多采用订阅制,例如语音工具 Wispr Flow 与 Willow 月费约 15 美元,部分产品还需将音频上传至云端服务器处理。另一款强调隐私的 Mac 端应用 SuperWhisper 虽然支持本地运行,但仍需按年付费,且无法覆盖移动端场景。

Eloquent 并未纳入谷歌常规的消费级产品体系,而是以 Google AI Edge 名义发布。该体系主要面向开发者,提供在 Android 和 iOS 设备上本地运行 AI 模型的工具与 SDK。这一归属让 Eloquent 不只是一个面向用户的语音工具,也承担了展示端侧模型能力的角色,用于向开发者和企业说明 Gemma 在实际场景中的落地能力。

据 The Next Web,过去一年主流科技公司正在加快推动 AI 模型向终端设备迁移,一方面出于隐私保护需求,另一方面也为了降低云端调用带来的延迟与成本。在这一趋势下,Eloquent 将端侧语音识别与文本处理能力落在日常输入场景中,成为目前较为直接的落地案例之一。

此外,对于以 Android 为核心阵地的谷歌来说,Eloquent 选择优先登陆 iOS 并不常见。过去谷歌在 AI 能力的发布路径上,通常会先在自有生态中落地,例如通过 Pixel 设备上的端侧模型或 AI Edge 相关 SDK 展示新能力,再逐步扩展到其他平台。

而此次在没有同步推出 Android 版本的情况下先上线 iOS,让 Eloquent 更像是一场单独试水,而非成熟产品体系内的常规正式上线。

结语:免费与本地处理,Eloquent 指向更低门槛的语音转写

Eloquent 把端侧语音识别、文本自动整理和基础内容处理放在同一个流程里,同时提供完全免费的使用方式,并允许在本地完成核心计算。这种组合此前多出现在不同产品或付费版本中,如今被整合进一个无需订阅的移动端应用中,改变了语音转写工具的使用门槛。

Eloquent 目前更像是 Google AI Edge 体系下的一次展示,其后续形态仍有待观察,例如是否会持续更新、是否扩展到 Android 并接入系统级输入场景。至少在现阶段,这款应用已经展示出一种更具体的方向,即将语音输入从云端服务转向设备本地能力,并以更低门槛进入日常使用场景。

来源:Google AI for Developers、The Next Web、TechCrunch

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 gmail 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论