智东西 昨天
刚被马斯克收购,Cursor甩出1.5万亿参数“核弹”:10万卡从零训成通用大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

编译 | 程茜

编辑 | 李水青

智东西 6 月 17 日报道,今日凌晨,在美国明星 AI 编程独角兽 Cursor 的首届大会 Compile 上,Cursor 联合创始人、CEO 迈克尔 · 特鲁尔(Michael Truell)剧透了和 SpaceX 合作打造的新模型。

新模型参数达到 1.5 万亿、从零开始在超 10 万块 GPU 上训练、不局限于编程而是通用智能模型。特鲁尔透露,相关训练目标已经完成,模型会在未来几周内正式发布。

昨夜,马斯克旗下 SpaceX 宣布正式收购美国明星 AI 编程独角兽 Cursor。SpaceX 以全股票交易方式收购 Cursor,Cursor 将成为 SpaceX 的全资子公司。伴随收购消息落地,昨夜美股开盘 SpaceX 股价应声大涨,盘中最大涨幅接近 17%,其市值一度排全球第四,仅次于英伟达、Alphabet、苹果。

特鲁尔回应了和 SpaceX 的合作,上述整套技术落地,依托于 Cursor 和 SpaceX 的合作," 相信大家也清楚,这早已不止是普通的商业合作关系 "。他还调侃说,近期行业整体比较平淡,他觉得这款新模型相关项目确实非常值得期待。

与此同时,Cursor 还官宣了两项新进展,其发布了移动应用 Cursor Mobile,以及上线原生适配智能体 Origin。

Origin 可以为开发团队与 AI 智能体提供一站式代码托管、评审及协同开发平台。特鲁尔称,Origin 是其对标 GitHub 的全新编程平台。该平台今年秋季正式上线,目前已开放候补名单预约。

有开发者猜测,Cursor 现已归属 SpaceX,这次合作顺理成章,他们可能会先训练一个 1.5 万亿参数的统一基座大模型,再搭建两套强化学习微调管线,分别供给 Cursor 编程工具与 Grok 通用大模型使用。

对于即将发布的新模型,特鲁尔透露了一些细节。

首先在参数规模上,这款新模型,参数规模和 Claude Opus、GPT-5.5 一样大。

其次这款模型是 Cursor 从零开始训练的,并非基于开源代码打造。特鲁尔称,虽然他们热爱开源,但从零开始能让其全面掌控所有变量,并针对关键工作负载进行更精细的调优。

计算资源是以往的 10~20 倍,这次是其首次将计算规模大幅提升。

此前,Cursor 自研的 Composer 1 到 Composer 2.5,训练数据集的规模都小得多,这束缚了其研发空间,他们持续迭代、不断优化模型的各项工作,都始终卡在算力供给,也就是 GPU 可运行时长上。而这次算力规模提升 10 至 20 倍,特鲁尔认为这足以支撑其冲击顶尖前沿模型水准。

模型不局限于编程领域,而是更为通用。

这是因为,Cursor 希望实现一个愿景,任何人都能借助电脑搭建出自己想要的任何应用。而实现这一目标的瓶颈,特鲁尔认为已经不再仅仅是软件内部的编程问题,而是涵盖一名工程师同事所能完成的全部工作。

这意味着模型要能熟练使用各类工程师工具、记录日志、测算运行耗时;能够完整完成软件测试、逐项点击操作界面按钮;同时还要具备出色的交互体验,向用户展示智能体究竟修改了哪些内容。

最后,特鲁尔还自夸了一下,他认为放眼整个 AI 行业,真正有能力同时自主设计产品体系与底层大模型的企业与机构寥寥无几。其他同行企业的核心基因,要么是大型科技巨头,要么是起家于实验室、后期才转向服务开发者与应用创作者的机构。而 Cursor 自始至终都是围绕开发者打造的。

Cursor 和 SpaceX 完成深度绑定,一边,SpaceX 坐拥顶级算力资源,另一边,Cursor 深耕开发者生态、拥有成熟的 AI 编程产品与海量开发者用户,或加速改写全球 AI 编程工具与开发者服务赛道的竞争格局。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

spacex 编程 ai 马斯克 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论