来源:雷科技 AI 硬件组 | 编辑:三明治
不得不说,生成式 AI 真的改变了很多东西。
作为一个没啥艺术细胞的文科生,在生成式 AI 大模型出来前,我所能做到的 " 内容产出 ",也就是挥动手指,敲击键盘,让数字信号夹杂着中文字符出现在电脑屏幕上,仅此而已。
但现在,哪怕本身对绘画一窍不通、对乐理更是毫无理解,只要懂得提示词的编写,我就能够轻松 " 制作 " 不同风格的画作、" 产出 " 各种流派的音乐,就连播客这种号称 " 小而美 " 的传播媒介,似乎也没有那么神秘了。
3 月 25 日,网易有道宣布有道文档 FM 开启公测。
(图源:有道)
作为一款有声阅读、学习效率工具,有道文档 FM 号称支持拍照、文档、链接、长文本等多形式内容一键转播客,还能迅速提炼核心要点,生成简洁明了的总结与思维导图,让你一眼洞悉内容主旨。
我决定帮大伙试一下,是时候看看国产 AI 播客到底能不能打了。
想要体验有道文档 FM,其实还蛮简单的。
打开自己手机上的应用商店,搜索 " 有道文档 FM",看到那个像蓝色气泡的图标点击下载就行。
反正现在是公测阶段,又不需要邀请码啥的,我的评价是有手都会。
(图源:雷科技)
打开应用,你会看到一些官方制作的播客示例。
我先是试着听了一下随应用附带的 "《日航的奇迹》:飞向天际的涅槃 ",基本上就是通过生成式 AI 对原作进行了比较简明扼要的剖析解读,AI 主持人能够做到抑扬顿挫、自然停顿和模拟真人的吸气呼气声,听起来并没有明显的违和感。
当然了,这只是官方给出的例子,实际效果还得我们自己测试。
有道文档 FM 为用户提供了四种新建播客的方式,你可以拍照片、扔网址、扔文件,也可以只粘贴文字,需要注意的是,免费用户上传的文件不能超过 5MB,需要开启会员之后才能扩展到 20MB。
(图源:雷科技)
在导入文本后,有道文档 FM 会提供包含文本朗读在内的二十种播客类型供用户选择,不同的类型会对转写后的播客脚本带来一定差异,然后可以选择你喜欢的音色,它提供了 13 种男性声线、11 种女性声线,包括新闻男声、电台主播、深夜电台、元气青梅等。
(图源:雷科技)
为了测试转播客的效果,我特地准备了三段不同的文本。
为啥是三段,主要是因为免费体验次数只有三次。
第一段文本,是我早年间混迹 SteamCN(今 keylol)论坛所写的文章,《CRPG 简述》,约莫着 5000 字左右的文本,刚好可以看一下这种亚文化内容转写的效果如何。
接下来,只要点一下生成,实测 5000 字的文本大约耗时 2-3 分钟,你就能得到一个大约六分钟的,由两个 AI 主持人进行 " 深度探讨 " 的中文音频播客。
内容如下,感兴趣的读者可以自己下载听一下:
(图源:雷科技)
从内容上来说,有道文档 FM 很会抓重点,基本能把稿件中的重要内容摘出来。
以这段播客为例,从主播 A 迷恋上《神界:原罪 2》这款游戏作为引入,两位 AI 主播围绕着 CRPG 游戏类型的定义、CRPG 游戏的起源以及发展过程,讲得那叫一个头头是道。
(图源:雷科技)
它还可以将稿件打碎,并用口语化语言,在两人一唱一和中表达出来。
第二段文本,是我去年参加的一次群访,采访的对象是机械革命创始人潘春节。
嗯 ... 这次转化出来的播客脚本就显得有些死板了,不知道是不是因为对专访类内容资料不足的缘故,最终转化出来的播客脚本,基本就是两位 AI 主播在添加了一些语气词的情况下对原文进行复述。
(图源:雷科技)
幸好,除了这段播客外,为了方便阅读,有道文档 FM 还在页面上方给出了文字版,甚至还提供了 AI 总结和思维导图,让用户能够更有条理地抓住文本的知识点,怎么都是有用的。
第三段文本,是我在大学时撰写的一本三流小说,第一部分约 7.5 万字,正好可以测试一下有道文档 FM 的 " 小说剧场 " 选项。
诶,这次转写时间就长了不少,等了十几分钟后,有道文档 FM 总算是端出了一份长达 35 分钟的播客内容。
从转写的效果来看,有道文档 FM 确实能够识别角色的行动,并将背景、对话、行动以较合理的方式拆解并讲述下去,就是不清楚现在有什么 BUG,导致这段播客中频繁出现 " 让我们继续这个引人入胜的故事 " 这句话。
(图源:雷科技)
每当 AI 主播读到这句话,就会让人有种从内容中被抽离出来的感觉。
除此以外,目前有道的 AI 播客还有一些瑕疵。
比如有些男性声音,存在语速较慢,还无法控制语速的问题。
尤其是新闻男声和电台主播,男生磁性音色,再加上字正腔圆的咬字,或许会适合解说纪录片,但在播客中就过于突兀,相声评书的音色里甚至含有一些杂音,让人很是出戏。
但就目前来说,有道文档 FM 在内容上确实没有毛病,听感也算正常,最终产出的内容可能更接近于老师上课时的知识解读。
当然了,有道自己可以也是这样定位的。你可以对自己手头有的资料进行学习,也可以直接用公众号链接转播客,快速吸收今日要闻和知识,借助这玩意自带的 DeepSeek,你甚至可以实现提出问题,DeepSeek 给出回答,然后就能直接转写成播客内容吸收的体验。
比起放空大脑的享受,它的最大价值,或许还是丰富了学习的场景吧。
事实上,AI 播客的诞生距离我们并不遥远。
2024 年 9 月,谷歌的 NotebookLM 推出了名为 "Audio Overview" 的功能,该功能可以将用户上传的内容转换为音频对话,由两位 AI 主播进行讨论,其内容流畅,音质逼真,仿佛真的有两个人在对谈。
(图源:NotebookLM)
作为整个类型的开创者,NotebookLM 可能是这类产品里最有 " 创造力 " 的,因为它生成的脚本并不会拘泥于用户提供的内容,而是会在此之上进行相关内容的扩展,还能根据需要调整语速,男女主播吐字清晰,语音语调自然真实,在音频播放期间用户甚至可直接与 AI 主持人互动等功能。
对我们来说,这款产品最大的缺陷,估计是它只支持英文内容的生成这点吧。
不管咋说,这款产品的出现,让人们看到了 AI 播客的潜力。人们不但可以用它快速消化大量信息,把长篇大论变成有趣的对话,在做家务或者开车的时候 " 阅读 " 那些平时没时间看的文章,甚至可以用来准备演讲稿,听听别人 ( 特别是 AI ) 怎么看待你的观点。
受此影响,在 AI 技术的推动下,播客制作和分发变得更加便捷,涌现出了如 "Listen Notes"、"Podcastle"、"Descript" 等热门应用。这些平台利用 AI 语音转写、智能剪辑和音频增强等功能,大大降低了播客制作的门槛,使得更多人可以轻松地创建和分享自己的播客节目。
毋庸置疑的是,播客,将成为下一个 AI 涌入的赛道。
放在国外,这很顺理成章,因为播客在欧美算是个颇具市场号召力的领域,月度收听人数一度超过他们总人口的三分之一。
但在国内,一切大不相同,因为对中文互联网而言,播客一直都是种小众又有些神秘的存在,喜欢的人死心塌地,不懂的人隔着墙壁。
(图源:抖音)
移动互联网的普及,让广罗大众早就习惯了视频和短视频的内容消费体系,上下滑动的手指和高速刷新的视频流,更是让超高速信息获取成为了一种习以为常的事情,也使得播客这种相对 " 慢 " 的音频形式与快节奏的互联网显得格格不入。
当然了,并非每个人都会沉迷于视觉带来的感官刺激,凭借其独特的陪伴感和深度,播客还是成功吸引了一批忠实听众和创作者。当你在早晚高峰的地铁上,看到有人戴着耳机 " 闭目养神 ",却又时而露出神秘的笑容,那他很有可能是在听播客。
而我,恰好也算是个播客的 " 消费者 "。
在我看来,播客并不是什么 " 更为纯粹和深刻的交流方式 ",而是更接近于一种充分利用碎片化时间的媒介,它排除了视觉干扰,让你在通勤、运动、打扫卫生的时候,都能找到机会沉浸在对话和叙事之中,抓住一切时间汲取感兴趣的观点。
对效率至上主义者来说,这点真的挺难能可贵的。
只可惜,国内播客节目发展的情况,可远没有播客爱好者们想象的那么轻松,在亚文化播客圈里颇具影响力的 " 机核 ",甚至在近一年时间里接连撤裁了多位核心主播,变现与热爱之间的冲突似乎正在愈演愈烈。
有道文档 FM 的存在,在一定程度上算是填上了 " 中文 AI 播客 " 这个市场的空白,它从学习的交互形式出发,将文档内容直接生成 AI 播客,给用户提供了一种对特定知识进行大量有效输入的方法,是一款非常适合学习的 AI 应用。
曾经小众的播客,会因为被教育场景盯上而不再小众吗?
或许只有时间能给我们答案。
End
登录后才可以发布评论哦
打开小程序可以发布评论哦