格隆汇 05-09
赶超GPT-4,中文能力“地表最强”,通义千问2.5来了!国产大模型迈入核心竞技场?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 竞赛场上,海外巨头 " 厮杀 " 甚是激烈,国内大模型的进化也上演加速度。

5 月 9 日,在北京举办的阿里云 AI 智领者峰会上,通义千问 2.5 正式发布。

此次,大模型不仅能力实现大升级,性能还全面赶超 GPT-4 Turbo,成为 " 地表最强 " 的中文大模型。

赶超 GPT-4

阿里云表示,相较于通义千问 2.1 版本,通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%。

对比 GPT-4,在中文语境下,通义千问 2.5 在文本理解、文本生成、知识问答 & 生活建议、闲聊对话,以及安全风险等多项能力上均全面赶超。

在这轮竞争激励的 AI 大模型浪潮里,这是国产大模型首次取得这样的成绩。

在长文本处理方面,通义千问 2.5 支持单次最长 1000 万字文档的处理,并且同时能够处理多达 100 个文档。

通义千问还支持对 PDF、Word、图表等多种不同格式的文档进行处理,满足了用户多样化的需求。

除了通义千问 2.5 之外,阿里云还发布了一组新 " 战绩 "。

阿里云首席技术官(CTO)周靖人在会上表示,通义大模型已经通过阿里云服务企业超过 9 万家,通过钉钉服务企业超过220 万

通义千问 API 日调用量已破亿,通义开源模型的累计下载量突破 700 万次

另外,通义落地应用的进程也在加速,目前已经涉足 PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等多个领域。

其中,小米旗下的 " 小爱同学 " 也与阿里云通义大模型达成合作,并将在小米汽车、手机等多类设备落地。

另外,通义千问最新开源的 1100 亿参数模型——Qwen1.5-110B也收获了最佳成绩。

在 MMLU、TheoremQA、GPQA 等基准测评中,该模型超越了 Meta 的 Llama-3-70B,成为开源领域最强大模型。

通义灵码宣布推出企业版。通义灵码是国内用户规模第一的智能编码助手,基于 SOTA 水准的通义千问代码模型 CodeQwen1.5 研发,插件下载量已超 350 万。

峰会上,阿里云强调要成为 "AI 时代最开放的云 ",通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。

国产大模型迈入核心竞技场?

去年 4 月,通义千问正式问世。

恰逢一周年之际,通义千问大模型的进阶,也意味着国产大模型更上一层楼。

自 2022 年 ChatGPT 发布以来,AI 大模型在全球范围内掀起了有史以来最大规模的人工智能浪潮。

可以说,过去的一年,这个圈子是 " 要多卷有多卷 "。

当下,OpenAI、谷歌、微软等猛 " 砸钱 " 不断革新着自家产品。除了海外巨头 " 你追我赶 " 之外,国内大模型也是 " 浑身使劲 " 紧追其后。

据 SuperCLUE 团队研究数据,国内大模型的进展大致分为三个阶段,即准备期、成长期、爆发期。

目前,除了阿里通义千问、百度文心一言、华为盘古等科技大厂 " 马不停蹄 " 加紧研发国产大模型外,还有复旦 MOSS、中科院紫东太初、初创黑马 - 月之暗面的 Kimi 等陆续脱颖而出。

从行业发展来看,银河证券表示,未来通用 AI 大模型领域可能会更加集中在头部厂商,更多厂商需要向行业专业化转型,垂直类 AI 大模型、端侧 AI 大模型将是未来主战场,市场空间广阔。

建议关注上游算力基础设施相关机会,国产算力产业链及生态伙伴相关机会,以及下游应用端领域。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

通义千问 阿里云 ai 开源 浪潮
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论