雷科技 6小时前
为了这次京东618,孙悟空和海尔兄弟都来直播了……
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

京东数字人有点厉害的 ...

不知道从什么时候开始,晚会这件事变得不再那么有趣了。

以前一到节假日,围着电视看晚会算是固定节目,一场晚会能让大家伙守在屏幕前看上几个小时。但现在年轻人的娱乐方式早就变成了短视频、直播和各种碎片化内容。别说两个小时的晚会,很多人连三分钟的视频都得开倍速。

所以说,当我看到京东给今年 618 整了个 " 赛博联欢会 " 的时候,第一反应其实是:真的假的?

抱着好奇心点进去一看,好家伙。

海尔兄弟、美猴王、大头儿子、线条小狗、卡皮巴拉水豚,一堆童年角色直接组团出道,就像是小时候家里的动画频道突然炸了,所有角色穿越进了同一个片场。更离谱的是,他们不只是站在那里报幕,而是真的在唱歌、跳舞、讲段子、整节目。

当海尔兄弟在舞台唱起童年的《雷欧之歌》,当慵懒的卡皮巴拉在舞台上不紧不慢地讲段子,当三只松鼠模仿起达人秀上的魔法节目时,你甚至会忘记自己正在看的是一群数字人的表演。

咋回事,莫非京东这波真的把数字人彻底玩透了?

先说结论。

这场赛博联欢会最大的感受就是热闹。

通过 IP+ 技术的玩法,以音乐剧、歌舞秀、单口喜剧、时装走秀轮番登场,掺杂着各种答题互动、实物抽奖,内容丰富到让人目不暇接。

要知道,过去数字人的画面和声音看起来并没那么丰富。

但京东这次显然不准备这么玩。

就比如海尔兄弟出演歌舞《绿茵狂想曲》的时候,他们不但嘴上在唱着雷欧之歌,还会配合着剧情和音乐节奏同步表演出各种足球动作,角色的语气、表情和肢体动作能形成连贯、统一的反馈,完全没有生硬的脱节感。

技术的进步也让应用场景进一步打开和拓展,舞台也从直播变成热闹的 AI 赛博晚会。

小雷专门去了解了一下,才知道,这背后其实是京东数字人 JoyStreamer 的多项技术能力在支撑。

前段时间,京东数字人推出了 JoyStreamer 和 JoyStreamer-Flash 两个数字人大模型,解决行业长期存在的文本指令控制力弱、多模态控制信号冲突、长时长生成能力不足等痛点问题,实现了长时长、自由态、实时互动的数字人生成效果。

这就让数字人告别了站桩式播报,能精准理解复杂指令,丝滑做出全身复杂动作,还能完美配合动态镜头轨迹以及背景的无缝变化。更绝的是,哪怕是在这种大幅度、剧烈运动的过程中,它依然能保持唇形与输入音频的完美同步。

你看,不论是在《次元派对》里走秀的十二姬,还是在《赛博星河》里走秀的数字人模特,她们都能很好地根据舞台设计完成配合演出,甚至连情绪转换和动作衔接都能像真人一样自然流畅。

这种以数字人为核心的技术,在卡皮巴拉身上体现得尤其明显。

作为这些年互联网最出圈的精神图腾之一,水豚最大的特点就是 " 佛系 ",而京东居然让这样一个角色上台讲段子,光是这个设定本身就已经足够好笑。

更有意思的是,京东后面还准备让它开启专属慢直播。

这背后其实对应着数字人行业长期存在的一个难题——长时间直播。

京东这次重点升级的长时长自由态能力,本质上就是解决这个问题,让数字人在长时间互动过程中依然能实现自然的交互体验、保持稳定的人设和逻辑。

而且随着原生数字人技术的发展,除了数字人对口型外,也增加了动作、表情等各类动作,让数字人的可看性大大提升。

例如可爱的卡皮巴拉,他或许不用一直高密度的讲话,哪怕把他摆在镜头前面,看到他懒洋洋地在桌面上挪动着,偶尔说几句互动一下,就有够呆萌的。

看到这里其实会发现,京东想做的已经不只是一个会说话的数字主播。

过去很多数字人更像一个 " 播放器 ",输入内容,然后输出声音。而现在的京东 JoyStreamer 已经开始向角色化的直播团队方向演进,在多 AI Agent 协同的支持下,它不仅能完成表演,还能随时互动、接住观众的梗,还能根据不同场景调整自己的表现方式。

而这些能力,也成为它在商业场景里快速铺开的基础。

要我说,这场赛博联欢会确实够精彩。但对于京东,真正重要的还是直播带货。因为晚会终究只是展示窗口,商家直播间才是数字人真正的主战场。

京东想验证这套技术能不能实打实地帮商家,将数字人的能力从单纯的能开播,拉升到全链路、多 Agent 的深水区,打造出一个行业领先的达播级数字人直播平台。

而今年 5 月中粮集团的一次合作,刚好展示了这套能力落地之后的实际效果。

在第八届中国西部国际投资贸易洽谈会期间,京东数字人把中粮原有的品牌 IP 形象直接做成了数字人主播,并同步上线福临门食用油、屯河食品等 13 家中粮旗下京东自营旗舰店,打造 24 小时在线直播间,同时还在中粮展台现场进行展示。

这个案例最有意思的地方在于,它展示出数字人的生产、经营流程正在被极大简化。

过去企业如果想做一个数字主播,往往需要准备大量素材、搭建拍摄环境、进行三维建模,整个流程不仅复杂,而且成本不低。

但现在京东数字人 JoyStreamer 提供的数字人能力已经把门槛压缩到了极低。

企业只需要上传一段真人直播视频素材,不需要绿幕、不需要专业摄影棚,也不需要额外制作三维模型,系统就能够快速生成一个在形象、声线、神态乃至直播间布景上都与真人主播高度一致的 " 数字分身 "。

只需要一次成功的直播,就能获得可长期、反复使用的数字资产。

不仅如此,过去一个成熟直播间往往需要主播、副播、运营、场控、策划、客服等多个岗位共同协作。对于中小商家来说,养活这样一个团队本身就是不小的成本。

有的负责讲解产品,有的负责运营策略,有的负责场控调度,有的负责互动应答,还有的负责商品展示和数据分析。这些 Agent 能够协同工作,共同完成原本需要多人配合才能完成的任务。

举个例子,对于中粮这样拥有多个品牌和不同产品线的企业来说,直播最大的成本之一就是脚本制作。

不同商品有不同卖点,不同活动有不同优惠信息,运营团队往往需要花费大量时间准备直播内容。

而京东数字人 JoyStreamer 把这部分工作也进行了自动化处理。

运营人员输入商品信息之后,系统的 AI 智能写稿功能就能够自动生成完整直播脚本,把产品卖点、促销活动和讲解逻辑组织起来。对于同时运营多个店铺的企业来说,这种能力能够显著降低内容生产成本。

与此同时,直播间里的商品展示也不再完全依赖主播口播。

借助智能 KT 板能力,产品参数、核心卖点和优惠信息可以同步进行可视化展示。观众不仅能听到主播讲解,还能直接看到对应信息,商品理解成本进一步降低。

就像这样,提到产品的某项卖点时,主播就会举起 KT 板并进行展示。

聊到产品细节时,主播也可以主动切出产品的展示画面,细致的眉笔展示搭配上事先准备好的话术,一般观众根本看不出什么违和感。

而且真人主播会累,会下班,也会受到时间和精力限制。

作为对比,京东数字人可以全天候在线运营,同时处理大量用户互动,并基于对用户洞察、直播间用户行为和实时流量情况,动态调整互动、画面、场控和促单策略。甚至在直播结束之后,系统还能够自动生成经营分析报告,对商品表现、用户反馈和直播效果进行总结,帮助商家完成复盘工作。

不难看出,京东数字人正在把头部达播关键能力转化为商家可低成本调用、可规模化复制、可持续优化的 AI 能力。

这套组合拳打出去,效果立竿见影。

市场反馈也证明了这一点,目前京东数字人已经服务超过 8 万个商家,今年第一季度开播数量同比增长 10 倍。对于一项商业工具来说,这样的增长速度已经足以说明它正在从技术展示走向大规模产业应用。

回头再看这场赛博联欢会,你会发现它其实并不只是一次娱乐活动。

表面上看,观众看到的是海尔兄弟、美猴王和卡皮巴拉这些经典角色重新登上舞台;但从更深层的角度看,这更像是京东数字人 JoyStreamer 进行的一次公开技术演练。

它利用大家熟悉的 IP 形象降低用户理解门槛,让观众在轻松观看节目的过程中,逐渐感受到数字人在内容生产、角色塑造、互动交流和直播运营上的能力变化。

而这些变化最终都会回到电商直播这个核心场景。

过去直播行业拼的是主播能力、团队规模和运营经验,很多能力只能掌握在头部机构和大主播手里。

而京东这次想做的事情,恰恰是把这些原本只属于头部主播团队的能力,变成普通商家也能低成本调用的 AI 能力,让数字人拥有接近 " 头部达播级 " 的直播体验。

对于商家来说,这意味着获取专业直播能力的成本正在持续下降。过去,只有成熟团队才能实现的全天候运营、实时互动、数据复盘和内容生产,如今,普通小商家只要愿意,随时都能拉起一支不知疲倦、二十四小时连轴转的顶配 AI 带货小队。

重点就在这里,对于大多数消费者来说,购物时真正关心的往往不是镜头前的人是不是碳基生物,而是自己的问题能否得到及时回答、产品信息能否被清晰展示,以及购物需求能否得到有效满足。

当数字人能够稳定完成这些工作,并且做到全天在线、高效响应的时候,关于真假主播的讨论或许已经没有过去那么重要了。

从会说话,到会互动;从会直播,到会运营;从数字主播,到数字团队,JoyStreamer 展示出来的其实是数字人进入 AI 原生阶段的一种可能。

而这场赛博联欢会,也许只是这个阶段正式开始的一个信号。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论