Alter聊科技 07-29
WAIC 2025观察:昇腾助力AI融入多元化生活场景
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 正在从 " 前沿技术 " 走向 " 生活基础设施 ",原本只有专业人士才能完成的工作,现在 " 有 AI 就够了 "。

撰文张贺飞

编辑沈菲菲

AI 的价值在哪里?

刚刚结束的 WAIC 2025 上,问题的答案越来越具象化。

站在产业的视角,AI 正在重塑企业的组织、生产与价值链。知名市场调研机构埃森哲的报告显示,69% 的企业高管计划在 18 个月内完成核心业务的 AI 化重构,AI 已经从可选项变为战略必选项。

而作为一个普通用户,我们的生活也在被 AI 潜移默化地改变。比如在 WAIC 2025 的昇腾 AI 展区,从 AI 即时通讯、AI 图像生成到 AI 声音克隆、AI 数据分类,连尚集团深刻诠释了 AI 和生活场景的融合。

在技术和应用的 " 碰撞 " 中,AI 不再只是 " 生产力 ",同时也是生活化场景向智能演进的 " 催化剂 "。

01.

大模型释放的"想象力"

在 WAIC 2025 上,我们看到了一个流行趋势——以 " 对话 " 为核心的 AI 互动,不再局限于独立的情感陪伴类产品,而是渗透进即时通讯、健康咨询、教育辅导等场景,营造出了差异化的用户体验。

直接的例子就是口信 APP,融合了即时通讯、互动交友、AI 智能人、数字元宇宙等功能,重构了 AI 即时通讯的产品形态。特别是 "AI 智能人 " 的功能,给我们留下了两个深刻印象:

第一个是千人千面的生命感。

"AI 智能人 " 不是设定好的剧本,而是像真人一样有情绪、有三观、有记忆,也会接受外界的时事政治、经济环境、体育娱乐等信息,不断影响 TA 的观点和性格,甚至有自己的生活和行程安排。

和电影《Her》的设定相似,"AI 智能人 " 和用户的关系将随着亲密度的变化与关系的变化,聊天话题的范围和内容也会有明显的差别。

第二个是无穷无尽的创造力。

"AI 智能人 " 被赋予了内容整合和创作的能力,在和用户沟通的过程中,不再是 " 套路式 " 的对话,而是深刻理解用户的诉求,进而扮演不同的角色,陪用户聊股票、聊新闻等等,满足了个性化定制的需求。

一个有趣的细节在于,"AI 智能人 " 会像真人一样发布自己的动态,阅读和评论用户的动态,乃至向用户 " 求安慰 "。

社交通讯只是日常生活的一面,除了有生命感的 "AI 智能人 ",我们在昇腾 AI 展区看到了更多被 AI 改变的生活场景。

比如融合了 AI 声音克隆和内容生成能力的 " 爸爸讲故事 ",可以克隆家人的声音,生成专属的故事视频;

整合了图像生成、换脸技术的脸趣 FaceFun,帮用户打造了专属的 " 私家写真照相馆 ",每个人都能得到属于自己的视觉大片;

以及 AI 赋能的 NAS 产品 GEAK 智慧云,可以通过人脸识别自动分类照片,并生成对应的人物相册,更为便捷的是,直接输入关键词就能搜索出相应的照片。

看似微小的体验革新,恰恰是 AI 落地的真正拐点:正在从 " 前沿技术 " 走向 " 生活基础设施 ",原本只有专业人士才能完成的工作,现在 " 有 AI 就够了 "。AI 的价值不在别处,在于让 " 美好 " 成为生活的常态。

02.

跨越 " 鸿沟 " 的技术路径

为什么现阶段的 AI 还未走进大多数人的生活?因为在落地过程中存在两个绕不过的痛点:

一个是时延,动辄几秒的内容生成时间,让对话变得 " 卡顿 ",语气再自然、表情再丰富,也难掩那种 " 等一等 " 的生硬。让人始终意识到:对面是台机器,而不是一个随时回应、充满情绪张力的 " 人 "。

另一个是上下文的限制,当前 AI 的 " 记忆 " 主要依赖上下文窗口,一旦聊天稍长一些、话题略微跳跃,AI 就容易出现 " 健忘 " 的现象——前面刚刚提到的名字、情绪、偏好或细节,后面就被 " 遗忘 " 了。

在人机对话的语境下,高时延、低连贯性产生的割裂感,不仅削弱了对话的流畅度,也很难让用户建立起 " 被理解 " 的信任感。想要构建连续、细腻、可信赖的对话,必须要在技术上跨越鸿沟。

针对以上两个痛点,昇腾提供的大 EP+PD 分离方案给出了解决路径。

大模型的推理过程可以拆解为两个阶段:第一个阶段是预填充(Prefill),处理用户的输入并生成初始 KV 缓存,就像人聊天前要先把对方说的话听清楚、理解透;第二个阶段是解码(Decode),负责后续 Token 的生成,可以理解为一字一句的回答。

在传统的串行推理中,需要先执行预填充,再进行解码,经常会出现 Prefill 阶段 " 忙得飞起 ",Decode 阶段 " 干等闲耗 " 的现象。就像一场会议,主持人一直在准备 PPT,发言人却只能在一旁等着。

昇腾的大 EP 方案实现了 PD 分离部署,即将 Prefill 和 Decode 阶段部署到不同的服务器上,分别作为 P 实例和 D 实例,并通过高速互联网络传输 KV 缓存等中间数据,在不同的服务器上同时进行预填充和解码。相当于开会时让 " 准备 " 和 " 发言 " 同步进行,极大地降低了时延,提高了资源利用率。

如果灵活性要求比较高,昇腾还实现了 AutoPD 分离部署,能够自动感知负载变化,无需人工介入即可自动伸缩 P、D 实例:需要计算密集型任务时,调拨更多 P 实例资源,需要应对访存密集型需求,则同步扩展 D 实例。打个比方的话,就是根据不同时段的交通流量,自动调整道路的通行方式。

可以佐证的是,昇腾通过 64 卡并行推理,达到了最低 50ms 的低时延和更高 E2E 吞吐,并且可支持 128K 超长序列,最终 POC 实测吞吐性能是业界传统方案的 1.29 倍。

折射到产品体验上,有了坚实的软硬件基础设施作为支撑,口信 APP 里的 "AI 智能人 " 化身成了 " 随问随答、能记得你上周说过的话,能懂你今天不一样的心情 " 的智能伙伴。

03.

技术和应用的螺旋进化

技术创新的终点,不是追求算力上的极限,也不是参数堆砌的模型竞赛,而是在场景中打造更温暖的体验。

正如口信 APP 场景下昇腾的技术适配与探索:改变世界的 AI,不在研究院,而在你我的日常生活中。技术从不抽象,正在加速生活化场景落地,就像 " 会陪你说话、懂你情绪的虚拟朋友 "。

诸如此类的创新还有很多。

比如 " 爸爸讲故事 " 生成故事视频的场景中,涉及到文本生成、图片生成、语音克隆等环节,需要良好的时序理解与统一调度能力。昇腾将视频生成的速度提升 20%,省下等待时间,把爱留给陪伴。

比如脸趣 FaceFun 的图像生成,昇腾重新定义了 " 体验感 ",让图片生成的速度从分钟级压缩到了秒级,无论是工业风的酷飒、暗黑哥特的神秘、美式校园的青春,还是胶片撕拉片的复古质感,都无需等待。

再比如 GEAK 智慧云的智能分类和搜索场景,昇腾软硬件提供可高精度、高性能的推理服务,有效提升了数据处理的准确率与响应速度,实现了更加精准、高效的数据分类与检索能力,让 " 回忆 " 更清晰。

据了解,业界已经基于昇腾适配和开发超过 80 个大模型,在基础大模型方面多个技术方向均有积累;超过 2700 个行业伙伴,基于昇腾孵化了超过 6000 个解决方案,在千行万业的落地中拓展 AI 的应用边界,不断壮大中国的 AI 产业生态。

背后所揭示的,其实是技术和应用的协同进化:技术上的联合创新一次次打破边界,层层叠加地提升了应用体验的上限;应用侧不断衍生的新需求,又反过来驱动技术层面的持续迭代和升级,最终形成螺旋式创新的正循环,让技术更懂场景,让场景更有想象空间。

把视角再放大一些的话,昇腾和伙伴们的生态合作,正加速推动 AI 产业链的上下游协同,通过更广泛的技术开放和更精细化的行业落地,证明了中国 AI 技术在全球舞台上的竞争力。

正如 WAIC 2025 发生的一幕:大大小小的应用厂商正在内容创作、智能社交、效率工具等品类落子,加速 AI 在生活场景的落地;来自教育、金融、政务、医疗等行业的一线企业,均已将 AI 融入业务主链,作为驱动新质生产力的核心引擎……

一场席卷千行万业、和每个人的生活密切相关的场景革命愈演愈烈。

主理人 | 张贺飞(Alter)

前媒体人、公关,现专职科技自媒体

钛媒体、36kr、创业邦、福布斯中国等专栏作者

转载、商务、开白以及读者交流,请联系个人微信「imhefei」

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 埃森哲 催化剂 核心业务 用户体验
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论