科技狐 昨天
360万奖金池背后,是腾讯为AI人才铺就的金光大道
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

大家有没有这样的经历?

当我在电商平台购买了一个吹风机,回到首页又会看到「猜你喜欢」在推荐另一个吹风机,这不禁让老狐陷入思考:电商平台是不是把我当囤积癖了?

经过一番研究,老狐发现这种问题的出现与电商平台使用的广告推荐算法有关,在用户购买吹风机后,算法会认为用户对吹风机感兴趣,继续给用户推荐吹风机。

不客气地说:这就是电商平台在人工智能的时代,做最人工智障的事情。

不过前几天,老狐偶然发现前段时间 2025 腾讯广告算法大赛的赛题——全模态生成式推荐,这个融合了文本、图片和视频等多模态用户数据,以及最新的生成式技术的广告推荐技术路线,就可能解决广告推荐不准、乱推荐的问题。

今天,老狐就和大家深入浅出地聊一聊「全模态生成式推荐」,为什么会被认为是广告推荐算法领域的革命,以及腾讯广告为什么要举办算法大赛,和算法大赛对行业发展有什么意义。

谈起广告,很多朋友都会流露出反感、抵触的情绪,对广告推荐的商品完全不感兴趣,但这其实并非广告的本意,毕竟消费者看了就反感,怎么会买单呢?但是为什么如今我们看到的广告,要么不感兴趣,要么就根本用不上呢?

老狐认为,这与 5G 时代的到来,移动互联网的视频广告内容迎来了爆发式增长有密切的关系。

如今用户数据从原本的「文本 + 图片」变成了「文本 + 图片 + 视频」,尽管广告系统能够获得更多的用户数据,但是推荐算法却无法利用上新增的数据类型。

消费者每天遇到的还是诸如「买了吹风机还会推荐吹风机」这种推荐算法乱来的情况。

而回到开头所说的「全模态生成式推荐」,作为多模态数据大爆炸时代诞生的技术路线,全模态生成式推荐路线天生具备融合「文本 + 图片 + 视频」多模态数据的能力。

因此,生成式算法可以为每一位用户创造个性化的推荐内容,即便是兴趣最小众的用户,也能够获得精准匹配其喜好的商品推荐,这不仅能避免引起用户反感,也为后续的点击、购买行为打下基础。

此外,它还具备「预测未来」的能力,能够结合多模态数据预测用户的下一步需求,比如当你看了一部老电影,搜了一些怀旧图片,听了一些 2000 年代的流行歌曲,算法就会猜测你当下可能处于怀旧的情绪中,为你推荐一些复古风格的商品,比如一个复刻苹果 Mac 电脑的充电器,进而推动你自然地下单购买。

有些朋友可能会好奇,既然全模态生成式推荐路线的优势如此明显,为什么迟迟没有在行业全面普及?

原因无他,只是做一个采用该技术路线的推荐系统简单,但是想做好就很难了。

若要真正做到落地、好用,仍然有 3 个最为显著的技术难点需要克服。

第一个难点,是「多模态噪声与缺失」。

对于生成式推荐模型来说,生成的商品信息准确性是最重要的。

但是在模型训练时,想要获取到足够高质量的训练数据非常困难。

许多数据都存在缺失率高、信噪比低等问题,比如商品图片清晰度差、商品图文不符和商品信息缺少等等。

这就好比给学生一本质量堪忧的教科书,他怎么可能取得好成绩呢?

第二个难点,是超大规模稀疏 ID。

对于大模型来说,决定其认知边界的是词表,通用的大模型词表(比如 DeepSeek R1)往往只需要 15 万以内的 Token 即可满足需求,但是对于用在广告推荐系统中的大模型,如此少的词表数量完全不够用。

电商发展至今,任何一家平台的商品 SKU 都早已破十亿有余,用户规模也是数亿起步。

与可以拆分为单独字词的句子不同,商品 ID 和用户 ID 信息是不可拆分的,这就意味着模型在训练、推理两种场景下,都不能简单地套用文本大模型的训练方法,否则就会遇到数据过量、显存爆炸等问题,必须从实际需求出发,设计一套契合广告推荐场景的系统架构。

第三个,是冷启动。

传统广告推荐算法采用的是「判别法」,是否会把商品推荐给用户,取决于这个用户是否和以往点击过该商品的用户兴趣标签一致。

如果这个商品缺乏点击数据,那么系统就不知道该怎么办了。

因此,如果生成式推荐模型想要避免一样的问题,就需要拒绝「刻舟求剑」式的传统推荐算法,而是要具备足够的泛化性,仅凭商品自身的信息,就能推测出潜在的感兴趣的用户是什么样的。

所以对于这种难却正确的技术路线,互联网广告行业该如何解决呢?

腾讯广告给出的答案是:以赛育人,通过举办大赛、提供高额奖金池的方式,为行业吸引、培育人才,应对行业技术革命过程中涌现的种种挑战。

在 2025 腾讯广告算法大赛的决赛中,参赛选手就提出了一个又一个不仅能够解决技术难题,还能够加速技术路线落地的方案。

冠军队伍 Echoch 就提出,为了应对用户行为数据杂乱无章的问题,他们构建了三级会话体系,将用户的行为数据像整理聊天记录一样归纳、总结,让原本混乱的数据,变成了容易翻查、有逻辑的资料档案。

在方案中,Echoch 还实现了让模型根据广告的需求,为用户的不同行为设定不同的权重,比如目标是转化时,模型会优先关注用户将哪种商品添加到了购物车、收藏列表,由此显著提升了广告目标的兑现率。

为了让模型生成广告推荐时更快、更准,Echoch 采用了 Dense 模型作为技术底座,不仅能以极快的速度在海量数据中精准调取最相关的内容,而且对性能的要求大幅下降。

单人参赛的「也许明天」则是证明了「训练数据更多、模型参数量更大、训练算力越强」的 Scaling Law 定律,在生成式广告推荐模型训练中也同样有效。

这不仅意味着,他为广告行业验证了训练生成式广告推荐模型时「加大训练资源、规模」是一条可行的道路,让业内人士能够放心扩大训练资源投入,不再担心投入的资源会打水漂。

如果需要用一个成语形容腾讯广告算法大赛是如何「以赛育人」,有始有终是最恰当的词汇。

许多人才不仅通过算法大赛对广告行业燃起兴趣,还因此进入了腾讯广告部门,成长为业务顶梁柱,开拓了人生的新篇章。

曾经单人闯入算法大赛决赛圈的王同学,不仅成功入职腾讯广告,还在负责腾讯视频、腾讯新闻等场景的广告变现业务中,利用大赛中提出的用户行为系列建模思路,通过优化 pCTR/pCVR(预估点击率 / 转化率)模型,大幅提升了广告的转化率。

此前逆袭进入复赛的张同学,也在大赛后入职腾讯广告,负责微信广告业务中,将自己提出的「新鲜度特征」思路融合进推荐系统,直接把广告点击率提升了 2%。

本次 2025 腾讯广告算法大赛同样也为有志于在广告行业发展的人才展开怀抱,凡进入决赛的所有队伍成员都有机会获得 Offer 意向书,前 10 名队伍中的所有成员 100% 能够获得 Offer 意向书,即使是进入复赛的成员也都能 100% 获得实习 Offer。

所以说,腾讯广告算法大赛不仅是为行业发展寻求人才,解决困扰全行业的难题,也是为人才的发展铺路,让人才不被埋没,在广告行业散发独特的光芒。

除了出于「以赛育人」的原因,还有什么因素使得腾讯广告愿意为此豪掷 360 万元人民币举办算法大赛呢?

老狐认为腾讯广告的品牌价值理念也是其中非常重要的因素。

纵观互联网广告行业,市场中并不缺少专心致志、一心谋利的平台,罕见的是愿意为了行业、社会的进步而贡献力量,并愿意承担起属于自己的社会责任的平台。

腾讯广告的选择是什么?

在传统广告算法难以应对多模态数据爆炸式增长带来的海量用户数据时,腾讯广告主动联络全球技术行业的专家,举办算法大赛,共同构建「产学研用」的协同生态,为技术领域导入丰富的人才、研究资源,让高校学生的学术知识与产业需求精准对接。

同时,为了进一步加速全模态生成式推荐路线的落地,腾讯广告将无偿开源训练数据集,为行业的发展和学术领域的进步提供弹药,共同推动广告行业的技术革命。

不得不说,腾讯广告不仅仅是生成式推荐广告领域的领跑者,更是互联网广告行业的技术风向标。

所以在传统广告算法陷入发展瓶颈之时,腾讯广告选择以赛育人举办大赛、引领行业发展,完全对得起其「技术造福行业与社会」的品牌价值理念,更是在积极践行腾讯「科技向善」的责任担当,为广告行业的可持续发展贡献了积极的力量。

回顾 2025 腾讯广告算法大赛,从「全模态生成式推荐」赛题公布,引来数千位技术人才的关注与参与,再到赛程中一支又一支战队不分昼夜地埋头苦战与互帮互助。

最后决赛环节,各个队伍竞相拿出看家本领,用极具前瞻性,且富有创造力的技术方案争夺桂冠,为行业奉上了一场无与伦比的技术盛宴。

一边是大量的人才,积极参与顶尖算法大赛,让人热血沸腾;另一边是腾讯广告真金白银、大力投入的魄力,让人不得不点赞。

老狐相信,2025 腾讯广告算法大赛的落幕绝对不是广告行业技术革命的结束,这只是全模态生成式推荐算法路线的新一轮技术探索的起点,大赛中的技术方案也将会在未来应用到实际的生产场景中,让更多的优质商品被有需求的用户看到,刷新大众对广告的认知。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 5g 移动互联网 人工智能 mac
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论