智东西 前天
中国AI开源16强,最新出炉!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | ZeR0

编辑 | 漠影

太卷了!太卷了!

智东西 8 月 2 日报道,刚刚,知名 AI 大模型评测 Chatbot Arena 放榜!

阿里

Qwen3-235B-A22B-Instruct-2507 位列大语言模型总榜第三,月之暗面 Kimi-K2-0711-preview、深度求索 DeepSeek-R1-0528 并列为总榜第五,以开源之姿超越 Claude 4、GPT-4.1 等顶尖闭源模型。

多模态大模型中,字节图像生成模型 Seedream-3 位列文生图榜第五,字节图像编辑模型 Seededit-3.0、字节开源统一多模态基础模型 BAGEL、阶跃星辰开源图像编辑模型 Step1X-Edit 分别位列图像编辑榜第五、第七、第八。

在 7 月 30 日公布的 Chatbot Arena 编程榜单中,深度求索 DeepSeek-R1-0528、阿里 Qwen3-Coder 并列第一,月之暗面 Kimi-K2-Instruct 位列第七。

其中,阿里

Qwen3-235B-A22B-Instruct-2507、阿里 Qwen3-Coder、月之暗面 Kimi K2 均是在 7 月最新发布的开源模型。

赶在 7 月收尾、8 月开头,中国 AI 大模型依旧在紧锣密鼓地上新,字节跳动、阶跃星辰、阿里、月之暗面近两天接连公布模型新动作。

周四晚,字节跳动 Seed 团队发布发布实验性扩散语言模型 Seed Diffusion Preview,阶跃星辰开源基础大模型 Step3。周五,阿里开源 " 甜品级 " 编程模型

Qwen3-Coder-30B-A3B-Instruct,月之暗面发布 kimi-k2 的高速版 kimi-k2-turbo-preview。

Hugging Face 还在周五发布了中国 AI 社区 7 月重点,回溯这一个月来令人眼花缭乱的开源浪潮,包括:

✨ 另一个 "DeepSeek 时刻 " —— Kimi K2

✨ Qwen 完全矩阵化 - Instruct / Thinking / Coder 模型跨越 30B – 480B 参数规模

✨ 多模态浪潮:

GLM-4.1V-Thinking: Image+Text > Text

Intern-S1: Image+Text > Text

Wan 2.2 – Text +Image > video

Skywork-R1V3: Image+Text > Text

Skywork-UniPic: Text > Image / Image > Text

Tar-7B: Any-to-Any

Ming-Lite-Omni-1.5: Any-to-Any

Step3: Image+Text > Text

HunyuanWorld-1: Image > 3D

ThinkSound: Video > Audio

Neta-Lumina: Text > Image

✨ 轻量级、可部署的模型

SmallThinker runs on 1GB RAM

✨ Agentic 编程成为主流

Qwen3-Coder: fully spec ’ d tool calling

GLM-4.5: browser agents, IDE assistant

Qwen3 WebDev demo: text-to-frontend code

✨特定领域和实用的模型 / 工具 / 数据集

Science one S1: Scientific model

Agentar DeepFinance: Finance dataset

ObjectClear: Interactive Vision Tool

Qwen3 MT Demo: Machine Translation Tool

其中回顾的 7 月 31 个亮眼开源模型、1 个框架、1 个数据集,来自 16 家企业、高校或研究机构:阿里(9 个)、月之暗面(2 个)、智谱(2 个)、阶跃星辰(1 个)、字节跳动(2 个)、昆仑万维(2 个)、智源研究院(1 个)、中国电信人工智能研究院(1 个)、蚂蚁集团(4 个)、快手(1 个)、捏 Ta(1 个)、中科院磐石(3 个)、上海交通大学(1 个)、腾讯(1 个)、上海人工智能实验室(1 个)、复旦大学(1 个)。

1、阿里(9 个):编程模型

Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型 Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基础模型 Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT 音频模型 ThinkSound,统一视频生成模型 Wan2.2-TI2V-5B,文生视频模型 Wan2.2-T2V-A14B。

2、月之暗面(2 个):MoE 基础模型 Kimi-K2-Base,与 Numina 团队联合研发的数学定理证明模型 Kimina-Prover-72B。

3、智谱(2 个):多模态大模型 GLM-4.1V-9B-Thinking,基础模型 GLM-4.5。

4、阶跃星辰(1 个):基础模型 Step3。

5、字节跳动(2 个):智能体模型 Tar-7B,多语言翻译模型 Seed-X-Instruct-7B。

6、昆仑万维(2 个):多模态推理大模型 Skywork-R1V3-38B,多模态统一模型 Skywork-UniPic-1.5B。

7、智源研究院(1 个):文生配音视频框架 MTVCraft。

8、中国电信人工智能研究院(1 个):

AI-Flow-Ruyi-7B-Preview0704。

9、蚂蚁集团(4 个):多模态推理模型 M2-Reasoning,多模态大模型

Ming-Lite-Omni-1.5,金融训练数据集 Agentar-DeepFinance-100K,交互式深度推理模型

KAG-Thinker-en-ch-7b-instruct。

10、快手(1 个):自适应思考模型 KAT-V1-40B。

11、捏 Ta(1 个):动漫风格图像生成模型 Neta-Lumina。

12、中科院磐石(3 个):科学基础大模型 S1-Base-671B、S1-Base-8B、S1-Base-32B。

13、上海交通大学(1 个):端侧原生大模型

SmallThinker-4BA0.6B-Instruct。

14、腾讯(1 个):3D 世界生成模型 HunyuanWorld-1。

15、上海人工智能实验室(1 个):科学多模态大模型 Intern-S1。

16、复旦大学(1 个):语音生成模型 MOSS-TTSD-v0.5。

前两天 Hugging Face 趋势榜前十直接被华人团队包揽。如今最新榜单中,华人团队占据前十中的 8 席,其中智谱占 2 席、腾讯占 1 席、阿里占 4 席、AI 大神李沐的美国创业公司 BosonAI 占 1 席。

从最新的 Hugging Face 趋势榜 TOP100,我们梳理出其中的中国 AI 开源团队名单,主要有 14 家企业及独立研究机构,分别是智谱、腾讯、阿里、上海人工智能实验室、月之暗面、阶跃星辰、捏 Ta、昆仑万维、小红书、字节跳动、蚂蚁集团、深度求索 DeepSeek、快手、智源研究院,还有上海交通大学(SmallThinker)、复旦大学(与阶跃星辰合作 OmniSVG)、香港城市大学(PusaV1)等高校。

智象未来(HiDream)、美团(MeiGen)、群核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、中科院磐石(ScienceOne)、面壁智能(MiniCPM)等企业的模型虽在最新趋势榜 100 名开外,但也是中国开源 AI 生态的重要力量。

加起来,积极拥抱 AI 开源的中国企业,超过 20 家。

尤其是阿里,是无人争锋的头号 " 卷王 ",卷得频率直接断层,在 7 月先后开源了音频模型 ThinkSound、多模态推理模型 HumanOmniV2、编程模型 Qwen3-Coder(480B-A35B-Instruct)、推理模型

Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基础模型 Qwen3-235B-A22B-Instruct-2507(非思考版)、电影级视频模型 Wan2.2、编程模型 Qwen3-Coder-Flash(30B-A3B-Instruct),并将新模型背后的 GSPO 新算法公开。

以下是位列最新 Hugging Face 趋势榜 TOP100 中的中国企业、独立研究机构及上榜模型:

1、智谱(7 个):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。

2、腾讯(3 个):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。

3、阿里(18 个):

Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。

4、上海人工智能实验室(2 个):Intern-S1、Intern-S1-FP8。

5、月之暗面(1 个):Kimi-K2-Instruct。

6、阶跃星辰(2 个):Step3、OmniSVG(与复旦大学合作)。

7、捏 Ta(1 个):Neta-Lumina。

8、昆仑万维(1 个):Skywork-UniPic-1.5B。

9、小红书(1 个):dots.ocr。

10、字节跳动(1 个):Seed-X-PPO-7B。

11、蚂蚁集团(1 个):Ming-Lite-Omni-1.5。

12、深度求索 DeepSeek(2 个):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。

13、快手(1 个):KAT-V1-40B。

14、智源研究院(1 个):bge-m3。

上榜的还有一些知名个人开发者,比如 Kijai,虽然无法确定国籍,但从其密集选用国产模型的动作来看,大概率是华人。

unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英伟达等海外团队位列趋势榜前 100 的模型,不少用阿里 Qwen3、阿里 Wan2.2、智谱 GLM-4.1V 等模型作为底模进行微调、蒸馏或量化。

最新 Hugging Face 趋势榜 TOP100:

在展现受欢迎程度的 "Most likes" 榜中,最后一次更新停留在今年 3 月份的旧版 DeepSeek-R1 依旧稳居第一。

不过,最受欢迎榜 TOP10 中,其他 9 席都是海外开源项目。期待中国开源模型继续追赶,取得更多的突破性进展。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里 开源 字节跳动
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论