每日经济新闻 03-28
国产AI突围,杭州三家科技公司大模型拿下HuggingFace趋势榜前三
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

近日,来自杭州的三家科技公司发布的大模型拿下全球最大 AI 开源社区 HuggingFace 趋势榜前三。

这三款模型分别是 DeepSeek-v3、群核科技 SpatialLM、通义千问 Qwen2.5-Omni。

《每日经济新闻》记者从阿里云方面了解到,Qwen2.5-Omni 采用了通义团队全新首创的 Thinker-Talker 双核架构,Position Embedding (位置嵌入)融合音视频技术,位置编码算法 TMRoPE(Time-aligned Multimodal RoPE)。

双核架构 Thinker-Talker 让 Qwen2.5-Omni 拥有了人类的 " 大脑 " 和 " 发声器 ",形成了端到端的统一模型架构,实现了实时语义理解与语音生成的高效协同。

3 月 27 日凌晨,阿里巴巴发布并开源首个端到端全模态大模型通义千问 Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni 以 7B 的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用 Qwen2.5-Omni 模型。

而近期群核科技发布的空间理解开源模型 SpatialLM,登上全球最大 AI 开源社区 HuggingFace 趋势榜第二位。

公开资料显示,SpatialLM 是群核科技自主研发的一款空间理解模型,该模型仅通过一段视频即可生成物理正确的 3D 场景布局。不同于传统大语言模型,SpatialLM 突破了对物理世界几何与空间关系的理解局限,将在机器类人的空间认知和解析能力上发挥重大作用。

而据《每日经济新闻》此前报道,3 月 24 日,DeepSeek 发布了 V3 的一个小版本更新,版本号为 V3-0324。虽然官方称这只是 " 小版本升级 ",但实测能力接近 V3.5 版本,尤其在复杂逻辑和多模态理解上表现突出。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 杭州 物理 通义千问
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论