钛媒体 5小时前
AtomGit正式上线,中国开源AI雏形已现
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

11 月 21 日中国开源产业发生了两件重要的事情,一个是开放原子开源基金会旗下开源鸿蒙(OpenHarmony)与开源欧拉(openEuler)成为首批毕业项目(" 毕业 " 是开源项目运营中的重要发展节点,标志着开源项目在技术、社区治理和生态发展上的全面成熟。毕业项目不仅具备强大生命力和可持续发展能力,还将为全球开发者和用户创造深远影响,推动行业创新和技术进步);另一个是全新升级的 AtomGit 平台正式上线,这标志着新一代平台正在加速赋能中国开源与 AI 生态发展。

根据 GitHub 2024 年度 Octoverse 报告,平台全球开发者总量已突破 1.5 亿,其中过去十年间的活跃开发者(Active Developer)达 2280 万,仅 2024 年就新增超 300 万活跃开发者,实现十年翻倍式增长。在这股浪潮中,中国开发者的崛起已成为不可忽视的变量。据《中国开源发展深度报告(2024)》数据,我国开源生态发展迅速,活跃开源开发者数量全球领先,2024 年达到 227 万人,在核心代码库、关键基础软件、行业应用等关键环节持续贡献力量。

从市场规模看,2025 年至 2030 年全球开源软件市场将保持 8.5% 的复合增长率,2030 年有望突破 1500 亿美元,其中云计算、AI、物联网是三大增长引擎。细分领域中,AI 开源市场表现尤为突出。

中国在开源规模上的崛起更为迅猛。AI 领域,Qwen、DeepSeek 等开源大模型全球下载量超 3 亿次,衍生模型达 10 万个,在 HuggingFace 社区占据 30% 以上份额。

在技术影响力层面,中国开源呈现出明显的 " 结构性特征 ":在 AI 大模型、云原生、大数据等应用层领域,以 Qwen、DeepSeek、PaddlePaddle 为代表的项目已进入全球第一梯队;然而在操作系统内核、编译器、数据库底层架构等 " 根技术 " 领域,话语权与治理参与度仍显不足。GitHub 2024 年技术影响力排行榜揭示,AI 大模型以绝对优势成为全球技术创新的首要引擎,其跨学科、跨国界的 " 超级创新网络 " 效应远超其他领域;与此同时,云基础设施成为稳固的数字底座,RISC-V 与大数据等新兴领域加速 " 硬科技 " 与 " 数据智能 " 的融合。中国在此格局中,正处于从 " 生态参与者 " 向 " 生态共建者 " 转型的关键节点。

如何 " 价值化 " 成为难题

规模的膨胀并未带来价值的同步增长。IDC《AI 与大数据开源生态研究》指出,中国开源项目的平均商业寿命不足 18 个月,70% 的项目在发布后一年内活跃度骤降,仅有 3% 的项目能形成持续盈利的商业模式。

对比国际市场,RedHat(红帽)的 OpenShift 容器平台年营收超 30 亿美元,Canonical 的 Ubuntu 系统通过企业服务实现稳定盈利,而中国头部开源项目的年营收多数不足千万元。

这些数据的背后,是开源产业规模虽然在持续增加,但所产生的 " 价值 " 却与规模的增加不匹配。

这种失衡在 AI 开源领域尤为明显。一方面,Gartner 发布的数据显示,2025 年全球开源软件市场规模已达 1500 亿美元,年复合增长率 12%,其中 AI 开源领域贡献 600 亿美元营收;另一方面,英伟达发布的数据显示,中国拥有全球 80% 的开源大模型,但这些模型的商业价值转化效率极低。

在开源 AI" 失衡 " 的表象下,中国 AI 开源社区在爆发式增长的光芒下,也面临了三大系统性挑战。

首先是算力 - 框架 - 模型的 " 铁三角 " 割裂。 开发者不得不在英伟达 GPU 与国产昇腾 / 寒武纪芯片、PyTorch 与 PaddlePaddle 框架、Hugging Face 模型与国产大模型之间艰难切换。据 Gartner 2024 年 AI 基础设施报告,平均每个 AI 项目需花费 35% 的时间在环境配置与适配工作上,这严重拖慢了创新节奏。

其次是代码与模型的 " 双轨制 " 协作。传统软件开发使用 GitHub 进行版本控制,而模型开发依赖 Hugging Face 的模型仓,两者在权限管理、CI/CD 流程、安全审计上完全分离。CSDN《2024 中国 AI 开发者生存状态调查》显示,92% 的开发者强烈希望能将代码、模型、数据集在同一平台管理,以避免信息不一致与流程断裂。

第三是从 " 跑通 Demo" 到 " 生产交付 " 的鸿沟。开源社区充斥大量 " 能跑就行 " 的模型,但缺乏企业级的 DevOps 工具链支持,导致模型难以复现、审计与规模化部署。IDC 数据显示,仅 12% 的开源 AI 项目能最终进入生产环境," 最后一公里 " 交付能力成为中国 AI 产业化的最大瓶颈。

" 中国答案 "

过去十年,开源世界形成了清晰的 " 分工格局 ":GitHub 定义代码协作标准,Hugging Face 统治模型分发市场。这种分离在 AI 早期阶段无可厚非,甚至促进了专业分工。但当大模型进入 " 软件工程化 " 时代,其弊端日益凸显:

首先是版本失控。模型权重与训练代码分处两地,README 与模型卡(Model Card)信息极易不同步,导致复现灾难;其次是权限孤岛。代码仓库的 RBAC 权限体系无法延伸至模型文件,敏感模型的访问控制成为难题;再次是流程断裂:代码提交(PR)无法自动触发模型训练与评测,持续集成沦为空谈;第四是审计真空。模型从训练到部署的供应链缺乏 SBOM(软件物料清单)支持,合规风险高。

一面是企业级 AI 应用已经是不可逆的趋势,另一面是大模型软件工程化面临的挑战,企业需要的是一个融合了 GitHub 与 Hugging Face 的,具备 " 代码 + 模型 + 数据 + 算力 " 融合能力的一体化平台,才能在兼顾传统软件开发与 AI 应用落地过程中更为顺畅。

在此背景下,开放原子开源基金会携手 CSDN 等生态伙伴,推动平台深度融合与能力升级,聚合开源模型、数据集及异构算力资源,共同打造中立、开放、公益的新一代 " 开源 + 人工智能 " 一体化基础设施平台—— AtomGit,发布人工智能开源社区,并于 11 月 21 日举办的 2025 开放原子开发者大会上正式上线。据开放原子开源基金会理事、开源共创科技有限公司董事长蒋涛介绍,本次升级将 AtomGit 与 GitCode 深度融合,汇聚代码、模型、数据与算力资源,构建国内首个面向 AI 研发的一体化服务体系。与此同时,AtomGit 还能为生态中更广泛的开源项目提供代码托管、安全检查、合规治理、服务运维等支持。

据悉,新一代 AtomGit 在原有开源协作和社区服务能力基础上,整合 GitCode 平台的产品能力,导入 AtomGit 开源项目、开源模型,构建了模型托管、数据集托管、工具链集成与算力集成四大核心能力,进而实现了代码托管与 AI 资源托管能力的融合。

不过在实现 " 融合 " 的过程中,AtomGit 还是面临了一些挑战,对此,蒋涛表示,平台融合过程中主要面对了三大挑战。

一是多元算力的融合与统一调度、管理," 如何高效整合异构计算资源(如 CPU、GPU、NPU 等),实现统一调度与管理,确保不同 AI 任务和代码构建任务能够灵活适配算力,是面临的首要挑战。" 蒋涛强调。

二是系统架构的融合——将原 AtomGit 的代码协作能力与 GitCode 社区服务能力进行整合,涉及账号体系、权限管理、存储架构等多模块的统一。

三是满足用户体验的一致性," 在功能融合过程中,保持界面交互、工作流体验的统一与流畅,降低用户学习与迁移成本。" 蒋涛指出。

除此之外,因为要实现 " 代码 + 模型 + 数据 + 算力 " 融合的能力,这种一体化模式带来了系统复杂性的提升,其主要体现在存储多样性、任务调度、权限统一等方面。据蒋涛介绍,为平衡性能与稳定性,AtomGit 采取了以下策略:

一是在底层存储方面采用了一体化的设计理念。代码托管中的小文件采用高性能存储方案,模型与数据集等大文件则复用优化后的大文件存储系统," 两者共用一套底层存储架构,既保障性能,又降低运维复杂度。" 蒋涛介绍道。

二是平台采用了统一的账号与权限管理体系,实现了跨代码、模型、数据集资源的精细化权限管理,确保安全可控。

三是平台融合后,采用了资源调度与隔离机制,通过容器化与调度策略,实现算力任务的资源隔离,避免了高负载任务之间相互干扰的情况发生。

四是 AtomGit 平台通过建立全链路监控体系,实现对系统健康度、性能瓶颈的实时感知与自动修复,从而将平台的稳定性保持在可控范围内。 

Hugging Face 以模型为中心,代码托管能力薄弱。其 Hub 模式侧重模型分发,缺乏企业级 CI/CD。AtomGit 的 " 代码仓 + 模型仓 +Agent 市场 +DevOps 全栈闭环 ",本质上是将软件工程的成熟度带入 AI 开发。

"AtomGit 的终极目标是让模型研发像软件工程一样‘可复现、可审计、可交付’。这一定位切中了 AI 工程化的核心痛点。" 蒋涛如是说。

AtomGit 平台在模型服务方面已经为包括 " 文心一言 "、智谱 ChatGLM 等在内的多个国内主流大模型产品提供了模型托管、在线体验与运营支持服务。

伴随着 " 智能定义未来 " 时代的到来,开源 AI 的发展也已经走在了类似开源软件发展的 " 老路 " ——从 " 爱好者玩物 " 到 " 企业基础设施 "。Gartner 预测,到 2027 年,70% 的企业 AI 应用将基于开源模型构建。而在这背后,离不开的是 AI 开源社区及生态的不断完善。回看 AtomGit 平台发展的故事,并非仅仅是一个技术平台的升级,而是中国开源产业从 " 规模扩张 " 到 " 生态深化 " 的缩影。

谈及未来的开源 AI 社区的发展模式,蒋涛告诉笔者,以 AtomGit 为例,其未来的商业模式将围绕 " 基础服务 + 增值运营 " 双轮驱动," 在基础服务层通过提供代码、模型、数据集等资源的协作开发托管服务,构建平台生态基础;在增值运营服务层,为开源项目、开源模型、开放数据集提供运营推广、社区建设、商业化对接等增值服务,助力项目成长并实现平台商业化;在生态和产业层面,通过与厂商、科研机构合作,输出平台能力,推动行业开源创新与 AI 产业化落地。" 蒋涛与笔者分享了开放原子开源基金会对于 AtomGit,乃至未来开源 AI 社区商业运营模式的期许。

从全球视角看,开源 AI 正进入 " 工程化、产业化、Agent 化 " 的三重拐点。GitHub 与 Hugging Face 的分离架构,已难以满足下一代 AI 开发需求。AtomGit 的 " 一体化 " 路径,提供了一个具备可行性的 " 中国答案 "。(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨盖虹达)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 大数据 开源 云原生 鸿蒙
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论