倪叔的思考暗时间 18小时前
你禁你的,我搞我的:按不住的中国AI冲出一个U2大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

又禁了,又 xx 的禁了。美国人工智能企业 Anthropic 旗下两款最新大模型 Fable 和 Mythos 被全面禁止外国公民访问,甚至包括这家公司的外籍员工……

你禁你的吧,我们玩我们的。

1

中国 AI 犀利出圈

一边是美国 AI 闭关锁国,另一边,中国 AI 犀利出圈。" 港股 AGI 第一股 " 云知声在本月初发布了其最新通用大语言模型 U2。出道即巅峰。

基于快慢思考融合的 MoE(混合专家)范式构建,与大多数同行们堆参数、堆 Token 的路径截然不同,从而实现了 " 小参数强能力、少 Token 高产出、低算力低成本 " 的突破。

用行话来说就是用 3000 亿级别的参数规模实现了万亿级别参数的大模型性能。

更小更轻更便宜,但一样好用。有多便宜呢?售价仅为 1.9 元。

有多好用呢?综合能力跻身全球榜单 TOP 10。

海外权威 AI 模型评测平台 LLM Stats 更新的榜单中,U2 排名第 8。在平台收录的独立长上下文评测基准 LongBench-V2 中,以 54.4% 的 Accuracy 超越 Claude Opus 4.7。

呐,这可不是中国小圈子自吹自擂,这是全球权威公开的 AI 模型评测榜单。U2 的实力是第三方实打实用评测数据排出来的结果。

确实是有技术优势的,而且可以视作 " 另辟蹊径 ",属于全球独一份的技术创新。先飚几句行话,懂行的可以看看是不是真优势:

第一、架构层面,U2 提出了快慢思考融合的 MoE 高知识密度结构。

第二、训练层面,U2 构建了以课程学习、过程监督、Harness 协同演进为核心的训练体系。

第三、工程层面,TITO 全链路 Token ID 直通网关从根本上消除了多轮 RL 训练中的分词漂移问题,上下文自适应记忆操作算子为长程任务提供了原生的记忆管理能力。

简单翻译一下就是:可通俗理解为类似 " 多线程处理 " 的思路决定了其深度推理能力、编程能力更高效、响应速度更快;AI 能耗更低的同时处理结果更准确;训练出的能力可无缝对接 OpenClaw / Hermes 等主流 Agent 脚手架,适配度更高,同时成本更低。

2

测一下它真牛还是吹牛

已经有不少人公开了测评结果,可以说一片好评。那作为 AI 行业的深度观察者,我这边也手痒到不行了,开测。

根据普通爱好者最常用的 AI 能力以及本人的个人偏好,对 U2 的能力测评主要在三个点:推理、编程、Agent。

先看推理:

因为我平时关注科技与电商等行业,那刚好 618 结束,我让 U2 帮我生成一份今年 618 中国电商销量最高的十款商品以及背后的社会消费动因,测评结果如图:

思考了大约 3 分钟,平心而论,这个速度与常见的大模型相比不是最快的,但这反而让我感到放心,因为这个问题本身是有窄度的,限定了主题意味着我的要求更加明确,那么对于这个需求的处理过程(思考)自然需要精确调用信息。再来看结果:

这个结果是有点意外的,销量前三甲都是苹果手机;而且除了第六第七是面霜和空调,其余产品也都是——国产手机。U2 给出的总结是:2026 年 618 消费体现出品质化、智能化、健康化、国货化四大趋势。消费者更注重产品实际价值而非单纯追求低价。

按照我对 618 的数据掌握情况以及多方比对,这个结果是高度准确的,在推理层面,U2 确实是靠谱的。

再看编程能力:我的需求是,帮我编写一个适合 8 岁小孩的经典五子棋网页小游戏。U2 表现得很兴奋,仅用时 1 分钟就编写在了一个文档中,用浏览器打开即可游玩。

最后是 Agent 综合落地:我提出了一个非常复杂但大家又都很感兴趣的话题,就是分析一下 Space X 上市之后的走势。U2 在思考片刻之后给出的分析结果如下:

面对这个综合了多方要素的金融难题,U2 在很短的时间内精确调用了多种资源,自动抓取了所需的检索与分析工具,很快就生成了逻辑清晰、数据有出处、结论严谨的报告,展现了足够强大的深度结构化处理能力。

这种处理能力尤其让我动容的是:下限非常高,没有出现常见的大模型工具为了完成而疯狂幻觉的坏毛病,同时上限也肉眼可见的高,应用场景非常广泛,无论是哪个行业或者任何案头工作,它都能在最短时间内手到擒来,而且呈现结果可用度极高。从最基础的给出答案,进阶为可靠地帮助人实现任务,这个实测水平确实对得起这家公司忝列全球 AI 头部序列。

3

中国 AI 已经按不住了

云知声 U2 出道即巅峰,给我的感觉不是孤证,而是一个群星璀璨时代的必然结果。换句话说,想用 " 禁令 " 按住中国 AI 的群星时刻,已经不可能了。

首先技术上按不住。U2 不是一夜间出现的,它的身边有足够多的战友,DeepSeek、智谱、百川、通义、混元、盘古……中国大模型阵营的参战兵力已经多到让对手数不过来了。而且量变带来质变,就比方云知声用 3000 亿参数打出万亿性能,其实是有代表性的,大家都在逼自己用更少的资源做更多的事。这种能力不是靠禁令能封死的,因为它本质上是在解决全球性的技术到实战的最后一公里——如何用有限的资源创造无限的可能。

其次是产业趋势按不住。不是说中国 AI 已经天下无敌了而是说 U2 代表的这条技术路线、出圈姿势、这波产业浪潮,已经大势所趋。这家公司过去 14 年的技术历程,历经了中国 AI 与全球 AI 大发展的每个重要时刻,也正是在这场连续不断的产业化迭代攀升的历史进程中,持续涌现出了 U2 这样的技术突破成果。

这样的公司在中国不是一个,是源源不断的一批又一批。请问你拿什么禁?

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论