时代周报 07-21
打造2700万听障者的“翻译官”与银发族的“数字助手”,百度ESG实践的技术温度
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来源:时代周报 作者:唐洛

6 月 13 日,广东时代传媒集团主办的 "2025ESG 与高质量发展创新论坛 " 在京举行,论坛聚焦全球产业变革下的高质量发展路径,并揭晓了年度 "ESG 金羚优秀实践案例 "。百度集团成功入选 "2025 年度 ESG 典范企业 "。

当我们深入了解百度智能云智慧养老团队与 AI 手语数字人团队的实践现场,能清晰看到一条以技术突破解决听障人士的就医场景、独居老人生活问题等真实社会痛点的 ESG 路径。

图源:AI 制作

手语数字人:让 2700 万听障者被 " 看见 "

当谈及百度为什么要做手语数字人," 盲人的行动不便总能被注意到,但听障者因外观与普通人无异,常常被忽略需要帮助 "。百度智能云曦灵手语数字人团队负责人魏琪告诉笔者。

据 2006 年第二次全国残疾人抽样调查,我国有 2780 万听力言语残疾人,占残疾人总数的三分之一。

百度智能云曦灵手语数字人相关技术研发最早始于 2021 年。2022 年,北京举办大型体育赛事冬奥会,全球瞩目。当时,为了让听障群体更好的观看和实时理解赛事解说,百度智能云的数字人团队首次将 3D 数字人技术与手语翻译结合,AI 手语翻译的直播吸引了超过 1 亿人次观看,百度智能云曦灵手语数字人是官方唯一合作伙伴。不过,由于手语动作与语速难以同步,当时受限于技术,专业术语翻译准确率不足,最终依赖大量人工校验才完成服务。

赛后,感受到用户需求,百度智能云曦灵手语数字人产品团队开始加快投入双向手语翻译机的研发及生产。2023 年,百度推出了 AI 手语平台,研发了针对线上场景的 AI 手语数字人和针对线下场景的双向手语翻译机,这种一体机既能打出手语,也能翻译手语,能够在输入和输出两个方面帮助聋人对外沟通交流。

但产品研发仍需继续迭代。2023 年,百度智能云曦灵手语数字人团队通过与手语专家和聋人群体的接触和交流,了解到对于听障人士而言,不同城市、不同地区之间的手语表达因方言存在区别,没有绝对通用的手语词典。有趣的是,如果把不同城市的听障人士安排一起几个小时后,大家很快就能无障碍交流,这背后可能存在听障人士独特或相近的交流习惯。

因此,做智能手语翻译的关键难题是 " 手语翻译不是简单的手势对应,它有听障人士的语法逻辑,而听障人士词汇量远超现有语料库覆盖范围,且实际生活词汇量远超手语辞典中的词汇量,需要更多的手语范本加入语料库。除了补充词汇,翻译模型需要学会理解、拆分、组合,来对文本进行手语翻译。"

对于手语翻译模型而言,许多伴随社会发展新诞生的特定场景词汇也需要学习和扩充。以机场的 " 值机 " 为例,首先要让翻译模型理解 " 值机 ",再了解可以如何组句子,最后才能进行合理翻译。

面对庞大的词汇数据收集、录入及校验工作,百度智能云曦灵手语数字人团队在数据收集环节联动了上百位听障人士和手语专家,并和天津理工大学聋人工学院共同制定了面向人工智能应用的自然手语标注规范,建设了大规模自然手语翻译语料库。天津理工大学聋人工学院自 1991 年开创我国聋人高等教育的先河,素有 " 聋人小清华 " 美誉,也是世界四大聋人高等工科院校之一。

在语料库打造方面,以前的手语数字人动作僵硬,就像 " 没有感情的翻译机器 ",但真实的手语里,皱眉、撇嘴、点头都是表达的一部分,是表达情感和增强交流效果的重要因素。

为此,团队请来了多位听障人士和手语专家,查阅了整套《国家通用手语词典》,进行表情数据的收集、归纳、录制并逐个精修,丰富手语数字人的理解和表达。

图源:百度提供

AI 浪潮带来的技术革新,能够让手语数字人翻译的精简度和准确度都有所提升。

此前,团队在走访天津理工大学聋人工学院时,认识了天津理工大学聋人工学院的学生明静,明静每次走进医院,都被护士或是分诊台导医劝说回家带上父母再来。每一件日常小事,对于听障人士而言都困难重重。而当明静接触手语数据的采集工作并体验产品交互性测试后,她非常开心," 终于有人开始做这件事了 "。

在这个探索过程中,百度的技术突破沉淀了多项专利,例如,虚拟数字人处理、数字人表情生成、驱动数字人的模型训练等专利。比如在手语数字人表情生成相关专利中,通过表情生成模型可以实现手语数字人在表达不同情感时拥有相应的表情,如高兴、悲伤、惊讶等,使手语数字人的表达更加生动、富有感染力。据了解,百度数字人相关专利申请量已经超过 1000 件,这些专利为数字人技术在手语场景的应用提供着更加坚实的技术保障,也是百度在数字人技术领域不断探索的证明。

目前,百度智能云曦灵手语数字人已经能够识别语音、打出手语,在实时直播中用数字人形象进行手语同步翻译,通过百度数字人 4D 扫描技术训练的 AI 手语数字人,不仅能呈现出真实生动的面部表情,还可以如真人般流畅表达 11000 多个符合《国家通用手语词典》的手语动作,助力听障群体沟通。

魏琪在一次与聋人学生的线下交流中,询问对方觉得手语数字人是否有用?对方回复:" 有用。" 随后又描述了自己的体验感,以及相信 " 未来可以达到的效果 "。

魏琪表示:" 百度的团队在研发这个产品时,不单单考虑盈利,也会追求商业价值之外的社会意义。如果他没有告诉我,我有时会以为做这件事的价值感是自己理想主义的幻想,但当这名学生表示相信时,会带给我继续投入的信心。"

图源:百度提供

智慧养老:帮助银发群体跨越数字桥梁

除了听障人士,银发群体也是互联网时代不可忽视的群体。2023 年,工信部曾专门发文提出《促进数字技术适老化高质量发展工作方案》,其中提出要优化数字化技术适老化服务用户体验。根据最新普查数据,我国 60 岁及以上人口已经超过 3.1 亿人。

图源:百度提供

在百度智能云居民服务团队的养老产研负责人孙宇慧看来,老年群体的数字困境远不止 " 把 APP 字体变大 " 这么简单。孙宇慧告诉笔者,自从研发智慧养老产品,团队惊讶地发现一件事,全国各地老年大学都有手机课,重复教授智能手机基础操作,但这门课每月的老人复报率超过 50%。

" 不是老人学不会,是现在的智能设备根本没考虑他们的习惯。" 孙宇慧表示。例如,早期互联网产品的系统采用传统 NLP 技术,要求精准指令,可老人容易手抖,点不准屏幕上的功能按钮,此外,老年人对于年轻人习以为常的 " 左滑删除 " 等产品使用逻辑也陌生。这意味着适老化改造需要更深层的突破。

为了了解更多的老年用户使用习惯,获取更真实的需求场景,孙宇慧没有选择坐在办公室思考,而是选择实地调研。2023 年,他曾在山东淄博、天津河西区等地驻点两三个月,反复上门倾听了解老年人的使用体验反馈,手把手的教学、记录、调整产品需求。

通过反复调整产品设计,百度居民服务团队已打造了面向银发经济、社区经济、基层服务和治理场景的产品矩阵,包含标准化的居民服务智慧终端、居民服务轻应用、企业运营 SaaS、政府监管 Saas 等。

百度智慧养老 AI 系统研发负责人宋瑞东介绍:" 该产品矩阵构建于文心大模型(包括 ERNIE 4.5、ERNIE Speed 等大小模型)构建的多智能体(Multi-Agent)架构,能够实现多个智能体间的自主协同,适应老年人多样化的使用场景,可覆盖生活助理、健康监测、安全预警、媒资娱乐、订餐购物等复杂需求,实现跨场景、一体化的智慧服务体验。

通俗来讲,通过一整套覆盖医疗、就餐、团购、问答等不同场景的多个产品组成的智能体产品矩阵,搭载在百度的小度智能屏硬件等终端上,老人可以面对一个智慧终端产品,通过 AI 大模型的自然语言对话能力,通过语音对话可以轻松表达清楚自己的需求,从而在产品矩阵中自动调用相应场景的智能体。

" 例如,当老人说:‘我家马桶坏了,需要疏通马桶。’管家智能体就会帮老人预约上门服务解决诉求。因此,产品矩阵是由多个智能体自主理解需求后调用相应产品满足老人各种各样的任务。" 宋瑞东举例道。

当这套智能体产品矩阵要落地到硬件终端,还藏着不少 " 反常识 " 的调整。

孙宇慧以实际调研中的 " 下单购物页面是否需要购物车 " 的场景举例。通常购物 APP 都有购物车,但团队发现,老年人习惯和需求场景具备特殊性。

" 他们不会像年轻人一样‘逛’购物平台,而是通常有明确需求‘买双布鞋’等情况下才去购物,加上考虑到防诱导等因素,老年人购物场景可能不需要购物车,看准产品直接下单。而在食堂吃饭的场景中,就餐肯定需要一次点多个菜和主食,而点一个菜付款一次十分不便,这时候购物车就成了刚需。" 孙宇慧说道。

此外,百度的这套产品矩阵的记忆模块还能通过大模型提炼总结出关键信息,形成用户长期记忆,记录老人健康状况、饮食习惯、购买偏好等信息;在不同的场景下,Agent 会根据老人的个性化特征,做出针对性的建议与回复。

而这些场景,不能单纯靠逻辑推理,而老人用实际场景教会我们怎么做。宋瑞东认为,智慧养老思考下研发的产品,是要让产品从 " 听不懂 " 到 " 会办事 ",围绕老人的需求进行升级。

为了相关技术创新,百度智能云已对相应的智慧养老方案所涉及技术进行专利布局,这套名为 " 养老服务管理方法 " 的专利技术,聚焦老龄社会服务痛点,融合语音识别、物联网与 AI 技术,打造 " 零门槛 " 智慧养老体系。老年人可通过语音自然交互实现就餐、就医、预警等服务调用,突破操作障碍。系统联动感知设备,实现服务闭环与主动响应,显著降低人工成本,重塑高效、安全、有温度的养老体验。

图源:百度提供

目前,百度居民服务团队近两年已服务超过 100+ 客户,覆盖泰康保险、中国平安、全景医学等行业巨头。百度还积极参与并助力制定了由住建部、工信部牵头的团体标准《基于智能家居的智慧物业居家养老总体技术要求》,为大模型在居家养老行业应用做出显著贡献。截至目前,已累计服务超过 10 万用户。在大模型智能体的加持下,用户体验实现质的飞跃。

事实上,百度的 ESG 实践并非局限于单一领域。在技术赋能社会的版图上,AI 手语数字人与智慧养老只是其中两块重要拼图。

在人才培养与就业领域,百度 2020 年提出的 "5 年内培养 500 万 Al 人才 " 计划已在 2024 年提前完成。在 Create2025 百度 AI 开发者大会上,百度创始人李彦宏宣布,未来 5 年,百度将加大力度,再为社会培养 1000 万 AI 人才。

此外,百度联合武汉市总工会推出的 " 劳动者第二技能学习平台 " 提供丰富的专家课程资源,为武汉 308 万名职工和 2.1 万个基层工会组织提供技能培训,帮助传统劳动者实现 AI 转型。目前已在北京、广州、武汉、南京等多个省市开放。

而在 AI 守护未成年人数字安全方面,2024 年,百度清理了 596 亿余条有害信息,通过设立专项审核小组,训练大模型精准识别高风险内容,使涉及未成年人的有害信息量下降了 74%,守护青少年的数字安全与自由。

技术投入的背后是人工智能领域持续的研发支撑。截至 2024 年底,百度 AI 全球专利申请超过 2.7 万件;AI 全领域中国专利申请超过 2.2 万件,授权超过 1.2 万件,连续 7 年 AI 专利申请量位居国内第一。

这些实践和成果,成为百度成功入选 "2025 年度 ESG 典范企业 " 的重要注脚。羚羊善于跳跃、长于奔跑,灵动而优雅。它适应性亦极强,栖居在草原、漫滩、沼泽甚至沙漠。硅谷亦有 " 瞪羚企业 " 一说,它们具有与 " 瞪羚 " 共同的特征——跑得快、跳得高、活力强。" 金羚 " 这一概念正是借鉴了羚羊的特质,寓意着企业应以 " 瞪羚 " 的韧性适应环境(E)的新要求,以协同能力协调社会(S)的新需求,以敏捷性响应治理(G)的新变化。

过去多年,百度推动智能云、智能交通等低碳方案落地,利用 AI 技术帮助听障人士便利生活、辅助视障开发者开展技术研发、守护濒危动物、提升老年人生活质量,推动技能普及与 AI 人才培养,通过 AI 赋能可持续发展,不断尝试 " 用科技技术让复杂的世界更简单 ",用实际行动诠释 " 技术向善 " 并持续创造更广泛的社会价值。技术的研发应用永无止境,而人类运用技术让生活更美好的探索也将不断向前。

(文中魏琪、孙宇慧为化名)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

百度 百度智能云 翻译 esg ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论