量化巨头们的AI大模型“野望”

在全球金融科技的版图中，量化对冲基金都是一群隐秘而强悍的 " 捕猎者 "。

他们依托数学模型与海量数据，在毫秒级的交易博弈中构建起极高的技术护城河。

在中国，幻方、九坤、宽德等头部量化私募，不仅管理着超 600 亿元的庞大资金，更在算法迭代与算力军备竞赛中，将金融工程的精度推向了极致。

但现在随着 AI 的快速发展，这三家站在资金与技术双高峰的大厂们，不约而同地将目光投向了更广阔的疆域：

大模型！

资事堂调研发现：三家量化大厂并非一次简单的同质化跨界，而是一场殊途同归的战略突围。

尽管三者皆以 " 大模型 " 为名，但其背后的演进逻辑却大相径庭：

有的试图复刻人类智慧的广度，直指通用人工智能（AGI）的终极形态；

有的选择深耕垂直领域的深度，致力于成为特定行业的超级专家；

有的则跨越数字与物理的边界，探索用解开科学未知领域的密码。

量化大厂凭借对数据的敏锐嗅觉、对复杂系统的建模能力，以及不惜重金投入算力的基因，让这三种截然不同的路径都充满了想象空间。

这场由三大巨头发起的 " 大模型进化录 "，正预示着中国 AI 产业下一阶段多元化落地的独特路径：

人工智能的终极价值，究竟是构建一个全知全能的 " 神 "，还是培育一群各擅胜场的 " 匠 "？

答案就藏在这三家机构的抉择之中。

DeepSeek：剑指 " 全能天才 "

在量化私募的版图中，幻方一直是个独特的存在，自 2018 年起在 A 股江湖声名鹊起，随后其净值曲线成为量化交易 " 风向标 "。

2023 年 5 月，由幻方实控人梁文锋牵头、依托幻方量化体系孵化并持续提供资金与算力支持的深度求索（DeepSeek）正式成立。

DeepSeek 的目标只有一个：AGI（通用人工智能）。

如今，"AI" 这个词已经被过度泛化，成了科技圈的 " 万能标签 "。从客服机器人到自动写周报的工具，甚至只是给照片加个滤镜，都被冠以 " 人工智能 " 的名号。

但 DeepSeek 所追求的 AGI，与市面上这些泛滥的 " 弱 AI" 有着本质的区别。

AGI 是要培养一个 " 全能天才 "。它不满足于在单点任务上刷分，而是追求让机器拥有像人类一样通用的推理能力、自主的学习能力和跨领域的迁移能力。简单说，AGI 是 " 通才 "，它能理解世界的底层逻辑，今天能分析股市 K 线，明天就能推导物理公式，后天能自主编写复杂的软件系统。

DeepSeek 的选择，意味着他们不再满足于做证券市场的 " 捕猎者 "，而是试图成为智能时代的 " 造物主 "。这种技术理想主义的色彩，在他们近期的人才招募中体现得淋漓尽致。

DeepSeek 最新的招聘启事中，对核心人才需求的描述颇有 " 区分度 "：

" 对世界充满好奇心，这种好奇心会自然延伸到对复杂系统底层运作机制的持续探索 ······ 不满足于被动执行，对通用人工智能（AGI）的技术路径与发展有着独立的思考与执着的好奇心 ······ 探索高价值 Agent 应用场景，推动能力落地与持续迭代。"

这段话其实可以这样通俗解读：

拒绝 " 工具人 "：他们不要那些只会照着文档敲代码的人（即 " 不满足于被动执行 "）。

寻找 " 本质探索者 "：他们需要那种看到问题，不仅想解决它，更想搞懂它背后 " 为什么是这样 " 的人。

资事堂还观察到：近一年 DeepSeek 团队接连发表多篇底层架构创新论文，梁文锋均为核心署名作者。这些论文分别从长文本稀疏注意力、训练稳定性的残差连接约束、知识与推理分离的条件记忆机制等关键方向入手，研究当前大语言模型最核心的基础架构革新问题，目的是让大模型训练更稳、长文本更快、推理更省算力等。

九坤投资：攻克大模型垂直领域的应用

九坤投资是中国第一代量化私募的 " 指标性 " 机构，其发展历程堪称中国量化投资行业的一个缩影。

早在 2017 年末，其管理规模便突破 50 亿元大关，成为当时中国规模最大的量化机构，而彼时大部分同行的规模尚在 10-20 亿元之间。

进入 2018 年，九坤投资继续乘势而上，规模迅速扩张，由此奠定了 " 北九坤、南幻方 " 的行业格局，近三年市场不时有其规模破千亿元大关的说法。

在量化投资领域突飞猛进的同时，九坤投资并未止步。

面对人工智能技术的飞速发展，九坤敏锐地捕捉到 AI 将为各细分领域带来的巨大变革。2025 年，九坤投资正式发力大模型领域，成立了 " 至知创新研究院 " 。

但与 DeepSeek 致力于打造 " 全能型通用大脑 " 不同，九坤并未选择去卷通用的 " 聊天机器人 "，而是另辟蹊径：它更倾向于训练 " 专家型 " 的垂直大模型，不追逐模型什么都懂，而聚焦于代码编写、医疗诊断等特定深水区里。

2026 年开年第一天，该研究院宣布全新开源一个代码大语言模型，该模型的功能是能读懂、能写、能改代码的 AI 助手，帮助程序员自动完成编程、修 bug、解释代码。

资事堂在至知创新研究院官网页面发现：他们正在攻关的三个核心课题。（如下图）

我们借助大语言模型，帮我们 " 翻译 " 三个课题的研究意义（如上图，从左至右）：

其一，传统的大模型处理复杂数据时很 " 吃力 "，九坤的研究旨在让模型变得更高效（计算成本更低）、更 " 懂 " 数据中的对称关系并且能线性扩展处理能力，这相当于打造更强大的 "CPU"。

其二，研究如何让大模型从一个单纯能写代码的 " 工具 "，进化成一个能自主思考、规划和执行任务的 " 智能体 "。

其三，迈向通用医学视觉推理的多模态大语言模型，让大模型不仅能 " 看懂 "2D、3D 的医学影像，还能 " 理解 " 手术视频等复杂信息，并成为医生的 " 超级助手 "。

或许，九坤正在给出的答案是：AGI 的演进不应是空中楼阁，这家大厂正试图以开源代码模型为支点，撬动更多垂直领域的智能化变革，最终为 AGI 的规模化落地铺设基石。

宽德投资：瞄准 " 科研超级人 "

2023 年，在 A 股市场整体低迷、募资难度极大的背景下，宽德投资却逆势迈过了百亿大关，新增规模超百亿元，一举成为当年整个中国证券私募圈的 " 募资王 "。

这一成绩的取得，很大程度上得益于其在前一年熊市里跑出的绩优业绩。

带着雄厚的资金实力和对技术的敏锐嗅觉，2025 年，宽德也正式加入了大模型的战局。

资事堂观察到：宽德的大模型定位不仅与 DeepSeek 追求 AGI 的宏大叙事不同，而且与尝试垂直领域的九坤也有本质区别：宽德则是要在 " 未知 " 的科学前沿中培养 " 探索者 "，直接加速人类对自然规律的认知突破。

我们来仔细拆解宽德智能学习实验室的官方表述：

他们要做的，是一个 " 超级科技助手（ASI for Sci-Tech）"。

根据宽德发布的战略愿景，其核心逻辑非常清晰：" 专注于研发通用性的超级科技助手，追求技术复利与持续性领先。"

通俗来说，宽德实验室想打造一个专门服务于科学研究和技术创新的超级助手。

宽德在官方渠道的表述中提及 " 以工业级研发的方式，探索 AI 能力的上限。"

再如：" 面向科学技术领域，持续推进模型能力建设与深度应用探索。"

那么，到底需要什么样的人来干这件事呢？近期，宽德招聘的核心岗位是 AI 研究员。

对于这个岗位的要求，官方描述得非常具体：

" 专注于开发下一代 AI 模型与算法，开展大语言模型创新研究并实现规模化落地。涵盖预训练、后训练、数据与评估、智能体系系统四大方向。

从宽德的布局来看，他们似乎找到了一条差异化的赛道：深耕 B 端的科研与工业场景。

这既符合其作为量化机构对数据和逻辑的严谨要求，也为其庞大的资金找到了一个具有长期想象力的技术出口。

至于这个 " 超级科技助手 " 能否真的成为科研人员的左膀右臂，我们拭目以待。