巴别鱼,源自科幻小说《银河系漫游指南》中那种能实时翻译任何语言的神奇生物,多语言 AI 犹如现实版的巴别鱼,正在打破人们之间的语言隔阂。
作为 2025 世界人工智能大会技术方向的议题之一,昨天在沪举办的 " 科大讯飞高级别高水平多语言基座大模型国际学术研讨会 ",汇聚了来自亚洲、欧洲近 20 个国家和地区约 30 位人工智能领域的产学研各界代表,10 位来自中国、英国、匈牙利、塞尔维亚、以色列、伊朗、泰国、马来西亚、柬埔寨等国的行业资深 AI 专家进行了主题演讲。
由于数字化语料稀缺,全球主流大模型对低资源语言的支持严重不足,小语种国家面临 AI 边缘化风险。如何弥合这一数字鸿沟,成为此次研讨会各国专家共同关注的核心议题。
星火大模型 X1 可以支持 130+ 语种
科大讯飞研究院院长刘聪介绍,最新升级的星火大模型 X1 可以支持 130+ 语种,在阿语、德语、法语、韩语、日语等重点语种整体效果已超过 GPT-4.1。通过混合语种路由等技术创新,星火语音大模型支持 100 个语种语音识别,整体效果超过 Whisper V3,星火语音合成大模型支持 55 个语种语音合成,效果业内领先。
科大讯飞研究院院长刘聪
刘聪在演讲中还系统阐述了讯飞星火多语种多语言大模型的下一步研发计划。他提出,未来的多语言模型将围绕三个核心方向展开:一是推进 " 语音 + 文本 " 多模态数据的共建共享,打通不同模态之间的语义壁垒;二是打造具备原生多语种语音能力的大模型底座,增强模型对全球语言生态的原生感知力;三是构建融合跨语言知识迁移能力的多语言通用大模型,实现不同语种间的知识迁移与泛化能力提升,全面支撑全球多语言 AI 应用发展。
科大讯飞智算业务部副总经理张骁认为,中国智算产业发展迅猛但面临效率挑战,行业普遍存在算力迭代过快、实际可用算力不足、存量算力使用效率偏低等痛点。他表示可以通过构建人工智能公共服务平台,实现算力高效调度和开发者生态建设,能够让算力资源得到有效利用,推动智算产业健康发展。
让每个人都拥有自己的 " 巴别鱼 "
英国萨里大学 " 以人为本的人工智能研究中心 " 联合主任宋一晢教授介绍了团队开发的 DemoFusion 与 NitroFusion 技术,能够在一块普通 GPU 上运行超高清、实时的生成式 AI 模型,让每一位创作者都能在本地设备上拥有 " 超级计算能力 "。
塞尔维亚诺维萨德大学技术科学学院主任 Vlado Deli ć 教授指出,塞尔维亚语在通用模型中 token 占比不足 0.1%,远低于斯洛文尼亚语。" 语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。" 为避免在医疗、法律等关键领域出现误译风险,必须构建符合本国语言特点和文化语境的国家级大模型。
面对这一系列挑战,国际合作成为重要解决路径。Vlado Deli ć 表示,希望通过与科大讯飞的合作,将本国语言技术纳入全球 AI 生态。双方已启动合作规划,计划将塞尔维亚语及相关南斯拉夫语言接入讯飞的翻译设备与智能应用系统,并以 2027 年贝尔格莱德世博会为阶段目标,打造本地化大模型。
讯飞星火大模型 X1 的语言能力已扩展至 130 余种,在翻译、推理、文本生成、数学等核心能力上已能对标国际一流大模型,特别是在幻觉治理方面取得显著突破,大大提升了大模型在行业应用中的可靠性。
据介绍,科大讯飞多语种技术已为华为、比亚迪、海尔等中国企业的 1.2 亿台套设备提供语音交互支持,涵盖 23 种语言,在非洲、东南亚等国家实地落地,为 " 中国智造 " 走出去提供语言与 AI 能力保障。在 AI 技术生态建设方面,科大讯飞已开放 813 项 AI 能力接口服务全球 53 万开发者,其中 272 项 AI 能力专门面向多语种需求。
登录后才可以发布评论哦
打开小程序可以发布评论哦