智东西 22小时前
网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 程茜

编辑 | 心缘

智东西 8 月 20 日报道,今天,网易有道集中展示了多项大模型成果,包括子曰 3 系列大模型的新进展,以及 AI 有道词典、有道音视频平台、有道 AI 答疑笔 SpaceX 等多项软硬件成果。

网易有道 CEO 周枫谈道,目前网易有道聚焦于广告和教育领域。

教育领域,其今年 6 月开源的子曰 3 系列数学大模型,是 14B 参数的轻量级推理模型,每百万 token 服务成本 0.15 美元,是通用大模型的 1/10。此外网易有道还升级了 AI 有道词典,二代 AI 答疑笔新增了全景拼图、视频答疑等功能,二代有道答疑笔 Wi-Fi 版本售价 1199 元,4G 版本 1399 元。

广告领域,网易有道针对电商、短剧出海等需求推出的有道音视频平台,可以处理 1GB、60 分钟音视频的原声人声翻译能力。网易有道智能应用事业部负责人张艺透露,目前处理一部 100 集短剧的行业平均价格为 1500 元,有道音视频翻译平台成本仅为 100 元,能一次性提供翻译、配音到润色的全流程服务。

对于 AI 教育行业的发展,周枫将教育行业类比自动驾驶的分级,他认为,教育 AI 正在从 L3 的学习辅助到 L4 的虚拟导师完成一次关键的跃迁。目前,AI 已经不是被动的应答者,而是具备了接近人类老师的思考能力,能主导引导学生思路甚至预判学生的难点。

一、AI 应用加速向高价值垂直场景渗透,有道聚焦教育和广告

周枫分享了基于当下大模型行业的发展,其对大模型应用落地、技术迭代的思考。

首先,他认为大模型的推理能力更强、思考更加深入,当下从推理迈向 Agent 时代体现出两大新变化,Agent 可以自主执行复杂任务,能自主完成此前需要人工分解的繁琐步骤;Agent 能自主检查和修正答案,可以攻克更难的问题。

第二个趋势是 AI 应用正在加速向高价值垂直场景渗透,在创意设计、市场营销、办公、医学研究等高度专业化场景的 AI 工具越来越好用。

在此基础上,网易有道已经形成了聚焦教育和广告两大领域的业务体系。

广告和市场营销层面,今年以来,网易有道依托模型能力,有道智选推出了小智广告 AI 优化师与创意生产工具箱 iMagicBox。

小智广告 AI 优化师基于 AI 投放决策模型可满足企业从投前到投后全流程的辅助决策,投前针对广告策略素材投放计划和行业素材解决广告主需求,投中一键生成最优的人群投放决策,投后生成投放问题的诊断报告;iMagicBox 可以帮助广告企业独立生成图像、视频模版。

这两大产品实现了企业从广告创意到投放优化的全流程智能化。

在教育层面,今年 6 月,网易有道推出 14B 轻量级子曰 3 系列数学大模型,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上各项得分均高于 DeepSeek-R1 等通用大模型,在数学解题和讲题方面的多个评测中,表现达到 SOTA 水平。

此外,网易有道子曰教育大模型在翻译和辅导场景进行了重点优化。

翻译场景,小语种翻译模型可以实现 38 种语言实时翻译,并具备多模态深度理解能力;辅导场景覆盖英文作文批改、文言文解析、数学习题拆解等全学科高频场景。

技术层面,小语种翻译模型实现基于单一模型原生支持 38 种使用语言。周枫透露,其研究人员实现了使得模型底层具备理解和多语言表达能力,并通过针对翻译需求的打分模型,进行多阶段强化学习训练,解决了模型翻译复杂句式、专业术语的难题。

在子曰 3 系列数学大模型上,网易有道同样采用了强化学习训练策略,引入难度加权策略等加强模型的解题能力等。

二、有道词典累计用户量超 10 亿人,有道音视频翻译平台开启内测

网易有道智能应用事业部负责人张艺透露,2023 年至今,网易有道 AI 应用订阅的销售额超过 3 余亿元,AI 功能整体渗透率超过 40%。截至目前,网易有道词典累计用户量超过 10 亿人次。据他们观察,词典用户的需求正变得更加细分、专业。

网易有道升级后的 AI 有道词典搭载了 14B 小参数的子曰翻译大模型 2.0,在翻译和多模态能力方面进行了升级,该模型已经实现翻译能力超越国内外通用大模型。

具体来看,首先是 AI 同传能力,其围绕识别能力、语言覆盖、翻译质量三个方面进行了升级。

AI 有道词典可实现抗噪声稳定识别输出,同时新增支持 71 种语言、125 种口音,以及经济、化学、计算机、医学等学术术语库。张艺称,有道词典 AI 同传已服务超 1000 万人次。

此外,他谈道,随着大模型的发展,AI 翻译已经进入多模态内容深度理解与生成的阶段,基于此网易有道展示了基于多模态大模型的 AI 翻译平台有道音视频翻译。

该平台内测版本已经上线,正式版本 9 月初发布,发布初期可以限时免费使用。有道音视频翻译平台支持任意语种音视频上传,实现原声克隆、人声翻译,已经在电商出海、短剧出海有所应用。

这背后的技术优势在于,网易有道研发了文本、音频、视频多模态一体化原声翻译系统 VocalFusion,可以识别主播的性别、年龄、动作、场景,进行深度还原。音色方面,有道自研 TTS 技术 Adaptive Voice Cloning,用户可以通过简单提示词调节主播说话的语气,如让说话声音更兴奋、更低沉等。

在时间方面,有道音视频翻译平台处理 10 分钟视频耗时 3 分钟,可以处理 1GB、60 分钟的视频。

三、AI 答疑笔升级,新增视频讲题、扫描拼图

今年 2 月网易有道推出 AI 答疑笔 SpaceOne,网易有道高级副总裁吴映晖透露,目前小 P 答疑累计响应次数已经超过 1.4 亿次,AI 答疑功能的使用频次从每人每日 4-5 次,到现在超过 10 次。他补充说,AI 答疑笔会先给学生关键提示,鼓励学生尝试自己解决,如果还是没有解决,会提供详细解决过程,分步解析,学生中途不明白的地方可以随时追问。

此次有道推出的二代 AI 答疑笔 SpaceX,新增了全景拼图、板书式视频答疑等新功能。

SpaceX 笔头宽度为 3.6cm,吴映晖称,据他们调研,这可以实现 80% 的题目一次扫描完成,对于带图片、长篇幅的题目,SpaceX 可以基于全景拼图功能自动拼接题目。

此外,有道将答疑功能放置到了答疑笔的第一入口,可以让用户快速调用相应功能,并且不同于拍照搜题,提笔扫描的交互方式,直接扫描可以简化用户打开摄像头、拍照等步骤,更便捷、速度更快。

讲题过程中,该答疑笔在文字分步骤答疑模式、苏格拉底引导答疑模式之外,新增了板书式视频答疑功能。这一新功能通过图片、文字、声音的形式,更适合于推演过程复杂、本身就有图片的题目。

硬件层面的升级,二代有道 AI 答疑笔搭载 4.4 英寸 OLED 全面屏,机身厚度为 13mm,重量为 105g,支持 4G 插卡上网,满电续航可以达到 7 天。

结语:软硬件融合破解教育、广告行业痛点

从有道词典笔到有道答疑笔,网易有道正不断发掘大模型在教育领域的多样化需求,并通过软硬件结合的方式推陈出新,解决更多教育上的痛点。与现在市面上的学习机等硬件形态相比,网易有道聚焦于扫读的交互形式,覆盖到其在查词、翻译等教育领域的更多高频使用场景。

与此同时,AI 应用正在加速向高价值垂直场景渗透的当下,网易有道基于其在多模态大模型领域的布局,聚焦于教育和广告领域,将进一步将这些场景的痛点与大模型发展深度融合。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 有道 网易有道 翻译
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论