瑞士加入全球 AI 竞赛，推出国家级开源大语言模型 Apertus

IT 之家 9 月 2 日消息，全球 AI 竞赛再添新参与者，这次是一整个国家。瑞士正式发布了国家级开源大语言模型（LLM）Apertus，希望其能成为 OpenAI 等企业所提供模型的替代选择。"Apertus" 源自拉丁语，意为 " 开放 "，该模型由瑞士洛桑联邦理工学院（EPFL）、苏黎世联邦理工学院（ETH Zurich）以及瑞士国家超级计算中心（CSCS）联合研发，这三家机构均为公共机构。

" 当前，Apertus 是领先的公共 AI 模型：由公立机构打造，服务于公共利益。这是我们迄今为止最有力的证明 —— AI 完全可以成为像公路、供水、供电一样的公共基础设施。" 推动 AI 成为公共基础设施的核心倡导者约书亚・谭（Joshua Tan）表示。

瑞士研发团队将 Apertus 设计为完全开源模式，用户可查看其训练过程的各个环节。除模型本身外，团队还同步公开了训练过程的完整文档、源代码，以及所使用的数据集。Apertus 的研发严格遵循瑞士数据保护法与版权法，对于希望遵守欧洲相关法规的企业而言，它或许是更优选择之一。瑞士银行家协会此前曾指出，本土研发的大语言模型具有 " 巨大的长期潜力 "，因为这类模型能更好地契合瑞士严格的本地数据保护法规与银行保密制度。目前，瑞士各银行已在使用其他 AI 模型满足业务需求，未来是否会转向 Apertus，仍有待观察。

据 IT 之家了解，Apertus 向所有用户开放使用：科研人员、AI 爱好者，乃至企业均可基于该模型进行二次开发，根据自身需求定制功能。例如，用户可借助它开发聊天机器人、翻译工具，甚至是教育或培训类应用。Apertus 的训练数据涵盖 1000 多种语言，总 token 量达 15 万亿，其中非英语数据占比 40%，包括瑞士德语、罗曼什语等瑞士本土语言。瑞士官方的声明称，该模型的训练仅使用公开可获取的数据，且其数据爬虫在网站上遇到机器可读的 " 拒绝爬取 " 请求时，会予以尊重。需注意的是，此前已有 Perplexity 等 AI 企业被指控爬取网站数据，并绕过用于阻止爬虫的协议；部分 AI 企业还因未经许可使用新闻机构及创作者的内容训练模型，面临法律诉讼。

目前，Apertus 提供两种参数规模的版本，分别为 80 亿参数与 700 亿参数。用户可通过瑞士电信（Swisscom，瑞士信息通信技术企业）或 AI 平台 Hugging Face 获取该模型。

宙世代

一起剪

相关标签