最近,我们三易生活在工作层面上,遇到了一次小小的 " 挫折 "。具体来说,在一天晚间,我们的一位同事需要参与一场技术沟通活动,在活动开始前我们告知 Ta,需要对活动全程进行录音,以便于能够在第一时间上线相关报道。
但结果是,一方面这位同事在活动开始 20 分钟后才想起来打开手机上的录音 App。另一方面,虽然他的手机已经价格不菲,但最终的录音效果却让我们的后方编辑听得直皱眉,基本只能听清他的声音,至于其他人的回答,则统统都像是 " 盖了棉被 " 一般模糊不清,让人难以据此下笔。最终我们不得不放弃第一时间进行报道的计划,转而等待相关速记资料,为此很是耽误了一些时间。
那么为什么会这样呢?从硬件层面来说,这可能是因为我们这位同事使用的手机内置麦克风硬件性能不足,或是麦克风在长期使用后被灰尘堵塞了。但从软件上来说,这也令我们不禁想象,如果他的手机能自带一个基于 AI 技术对录音进行自动增强,甚至是自动转写、总结、提取关键信息的功能,那么结果就可能会完全不一样。
这就是我们为什么要在 2025 年 10 月 14 日下午,2025 亚马逊云科技软件企业峰会暨亚马逊云科 Marketplace 全球卖家峰会期间,近距离与 Plaud 方面进行沟通的原因。
Plaud 不只是一根 " 录音笔 "
Plaud 是什么?关注科技办公设备、新概念 "AI 产品 " 的朋友,可能听说过这家最近异军突起的 AI 硬件品牌。
但需要注意的是,在 Plaud 的官网,他们其实更多地将自己定义为 "AI 原生硬件与软件公司 "。
在产品属性上,Plaud 的录音设备不只是拥有独特的、卡片式的造型,以及可磁吸固定在手机背部的设计,它还拥有比传统笔式录音设备更多的麦克风数量,基于 AI 的自动降噪、自动模式切换算法。
最为重要的是,Plaud 旗下的这些 AI 录音设备能够自动化地对每一次录音进行 AI 总结,甚至允许用户与 AI" 协同工作 "。例如 " 一键标记功能 " 就使得用户可以在录音过程中实时标注关键信息,或者是在 AI 的帮助下,将不同的录音总结内容生成为用户自己的 " 知识库 ",甚至是实现跨录音的知识点搜索。从某种程度来说,这不仅是传统录音笔做不到的功能,甚至也要比人工 " 速记员 " 都更加强大全能。
用好大模型与云计算,是 Plaud 的诀窍
那么,Plaud 是如何实现这样的产品体验呢?根据 Plaud.ai 合伙人、中国区 CEO 莫子皓透露的技术要点来看,Plaud 相比传统的录音笔或手机录音 App,主要是实现了两个方面的突破。
其一,是 Plaud 实现了大模型与用户基于 " 时间线 " 的交互,能够在对话过程中让人与大模型实时对齐。比如用户在录音过程中按一下 Plaud 产品上的按钮,此时大模型就会知道 " 刚刚的这一瞬间是这段录音的关键 "。又比如,如果用户在录音过程中打开手机拍了一张照,那么 Plaud 也会自动 " 意识到 " 刚才那张照片可能会和刚刚录音里的某句话之间,有逻辑上的关联性。
其次,就是 Plaud 不只是可以做 " 录音内容总结 " 这种 " 基础 " 的功能,甚至还可以基于自身的知识库以及大量总结出的模板,针对录音过程中的场景主动地 " 提出问题 "。
比如莫子皓就举了一个有趣的例子,在海外市场,一些警方人员明明已经有独立的执法记录仪,但依然愿意在工作中佩戴一台 Plaud 的设备。因为后者的大模型 " 接触了大量案例 ",因此可以在录音过程中就主动地提出 " 疑问 ",例如面前的被询问者是否在情绪上有很强烈的委屈感,其所面临的情况是否和过往某个案例有相似性,从而帮助执法人员更合理地进行沟通。
当然,在这种看起来既神奇又有趣的 AI 录音、AI 交互体验背后,来自亚马逊云科技提供的安全可靠、高性价比的一系列云计算、云存储解决方案,自然也就成为了关键性的驱动因素。
根据 Plaud 方面公布的数据显示,Plaud 通过利用亚马逊云科技的 GPU Spot 实例和自动扩缩容机制,将整体算力成本降 50%,同时在高并发场景仍能保证服务稳定性与低延迟。结合亚马逊云科技提供的弹性伸缩(Auto Scaling)与 GPU Spot 实例策略,Plaud 能够根据业务高峰与低谷动态扩缩资源,在支持数十万用户并发访问的同时,显著降低整体算力成本,有效提升可用性与经济性。
与此同时,亚马逊云科技拥有全球覆盖的基础设施,基础设施遍及 38 个地理区域的 120 个可用区,则助力 Plaud 为全球客户提供全球一致的高质量服务,且无需操心基础架构的运维管理,为业务拓展提供更好的运营支撑。继美西区域后,通过在欧洲等区域同步部署,Plaud 实现了对不同区域用户的就近服务,将跨区域用户访问延迟降低了 80%,显著提升了实时语音转写与生成服务的响应速度和用户体验。
当然,作为一款融入了 AI 大模型的录音设备和服务厂商,涉及到用户隐私数据的安全保护自然是重中之重。而亚马逊云科技不仅拥有丰富的在线安全产品,同时其遍布全球的基础设施也为 Plaud 实现不同地区合规化的数据脱敏、软件分地区(分版本)存储和功能提供,以及相关服务的长期、稳定、安全运行,打下了至关重要的基础。
如何让用户更满意,Plaud 有独门绝技
需要注意的是,关于 Plaud" 使用 " 大模型的方式,我们在与 Plaud 方面的交流过程中还得到了一个非常有意思的说法。
根据他们透露的信息显示,就在前几天,部分用户在某些场景发现,他们暂时失去了分享录音转写内容的功能。但这其实并不是一个 Bug,反而是 Plaud 独特的产品理念所导致的结果。
因为不管是国内外的大模型,都会有各自一系列的 " 安全措施 ",比如在侦测到用户输入一些涉及敏感的信息时,大模型可能会停止工作,或者拒绝给出回答 / 总结。
但在 Plaud 看来,这样的行为实际上相当于侵犯了用户对个人信息(比如较为私密的对话数据)的掌控权,因此他们宁愿临时 " 牺牲 " 掉分享功能,以此换来更高的录音转写 " 可用度 ",让 AI 可以不受那么多约束地帮用户总结只属于他们自己的对话历史。
类似的,Plaud 在日常工作过程中也有大量只属于他们自己的前置处理逻辑,以便更好地 " 发挥出 " 大模型的效果。这也就导致虽然名义上 Plaud 好像没有自己的 " 私有模型 ",但只要用过就会发现,他们的录音和 AI 转录效果就会比其他类似的产品,明显要好得多。
登录后才可以发布评论哦
打开小程序可以发布评论哦