智东西 06-17
刚刚,豆包AI播客上线:8万字文档秒变节目,语气词和停顿都像人
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 陈骏达

编辑 | 心缘

智东西 6 月 17 日报道,今天,豆包电脑版和网页版全量上线了 AI 播客功能。用户上传 PDF 或网页链接后,可一键生成双人对话的播客节目。

上线后,智东西第一时间对豆包 AI 播客功能进行了体验。实测中,豆包能将 8 万词英文文档在 3 秒内生成为播客节目,用户可在对话界面收听播客,收听的同时,豆包会并行生成后续内容。

豆包交付的 AI 播客节目以男女双人对谈的形式进行,能对用户上传的网页、文件等进行深度改造,使其更适合听众消费。

AI 播客对谈的节奏流畅自然,还会有大量的语气词、附和、停顿,这很好地模拟了真人博客中的口语习惯,有效提升了拟人程度。智东西还了解到,这两个声音是由字节与专业播客创作者联手打造的。

不过,在实测中,我们也发现了豆包 AI 播客当前存在的部分问题。例如,其生成节目的信息密度并不高,且含有大量重复的句式和语气词,在长时间收听后,用户可能会觉得有些单调。

日前,智东西曾与字节跳动语音中台负责人郑炜明进行交流,他向智东西透露,未来,豆包 AI 播客的收听体验会进一步丰富,不会只有简单的承接,还能有观点的交流与碰撞。团队已经在开发不同风格的音色,探索音色克隆、风格定制等功能,语种范围也会扩展至中文之外。

先前,豆包 · AI 播客模型已在字节旗下的 AI Agent 平台扣子空间上线,并支持一句话生成播客的功能,可自主查找相关话题,输出播客。

一、8 万词 PDF 文件秒出播客,还能自主给节目 " 划重点 "

豆包 AI 播客功能的入口放在了输入框下方,点击进入后,会跳转出两个选项。用户既可上传文件,也可将网页发送给豆包。不过,目前豆包 AI 播客仅支持 PDF 文件的上传。

首先来听听生成效果。智东西将一份 8 万余词、共 140 页的起诉书上传给豆包,在花费数秒钟解析文件后,豆包立刻返回了可供收听播客的播放器和一张播客封面图,完整生成一档播客的时间大约在 1-2 分钟,用户可以边听边等,不影响收听体验。

实测多个案例后,智东西发现豆包生成的 AI 播客基本遵循了一个特定的模式——女主持人负责控制播客的节奏、提问等,男主持人负责主要内容的讲述。

豆包 AI 播客所生成的节目的语言风格较为口语化,在收听过程中完全感受不到原文件中正式甚至有些拗口的表达。尽管智东西上传的是一份英文文件,也没有明显的翻译腔。

具体的收听体验层面,可以听到 AI 主播们会通过调整语速等方式来强调重点信息。豆包也会使用一些语气词和包含情感的评价,这加强了播客的 " 真人感 "。

在网页转播客场景,豆包 AI 播客能交付不错的结果,不会受到网页上无关信息的影响,基本可以准确反映网页主要内容。

在智东西先前参与的内测中,豆包还会在网页地址栏右侧提供 " 网页播客 " 的入口,不过在公测版本中,这一功能尚未上线。

二、可定制性、信息密度仍有提升空间,未来或扩展多人对谈、单口播客

目前豆包 AI 播客功能的提示词是固定的,用户无法给出播客制作的更具体建议,在可定制化程度上还有些提升空间。系统提示词很简单,就是 " 生成播客 "。

用户暂时也无法直接导出豆包 AI 播客的生成结果。有需要下载播客的用户可以移步 " 扣子空间 " 进行体验,在这一应用中,豆包 AI 播客及其封面都可导出,还能看到具体的逐字稿。

智东西用不同长度的文本测试了豆包生成的 AI 播客时长。最终,其生成的节目最长不会超过 10 分钟,大多集中在 5 分钟左右。这导致了一些问题:当用户上传高信息量长文档时,可能会被过度压缩和省略;上传简短的内容时,豆包也会煞有介事的讲上两三分钟。

在第一部分的测试案例中,长文档中后半部分内容便被完全省略了。在下方案例中,智东西将一篇数百字的快讯发送给了豆包,由于原本的信息量不大,最终其生成结果也略显单薄。大量语气词、口语化表述和模式化问答的存在,导致信息密度有待提高。

此外,豆包中提供的 AI 播客功能并不能对材料中的已有话题进行补充,提供背景信息,这可能导致播客在内容深度和广度方面有所欠缺。

结语:AI 播客已成热门赛道

近期,AI 播客已经成为业内一条相对小众、但获得诸多企业押注的赛道。除了字节的豆包 AI 播客之外,前段时间,国内头部播客平台小宇宙已经利用 MiniMax 的语音技术,内测了外语播客一键转中文收听功能。海外的谷歌 NotebookLM 生成播客功能更是收获一批忠实用户。

中国拥有全球增长最快的播客市场。2025 年,中文播客听众的数量预计将突破 1.5 亿。AI 播客有望通过给创作者提供便利、给消费者提供丰富的收听选择,进一步释放这一市场的潜力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 字节跳动 界面 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论