蓝字计划 04-23
中国AI,正分裂出三条路线
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者|Hayward

原创首发|蓝字计划

AI 的聊天功能一向被网友们调戏为 " 人工智障 ",网友和他们聊天以找乐子的居多。真的有人会和   AI   " 交心 " 吗?

你好,有的。上周一位网友晒出一张截图,是自己身患重病的父亲在去世前夕和与豆包的对话,第一句是 " 我要去世了,豆包 "。

现在的   AI   工具越来越 " 聪明 ",和它聊天时往往还能得到窝心的回复,不少小学生、老年人已经开始把   AI   聊天助手当作朋友。

我们对   AI   的依赖、AI   和我们生活的结合度,正走到历史新高。

发现了吗:过去搜索问题我们会先问百度,现在则会 " 问问 DeepSeek"、" 问问夸克 ";如果需要做旅游攻略,还可以交给豆包、夸克生成答案。

经过大浪淘沙后,中国海量的   AI   工具还渐渐形成了三条不同的前进路线,上面提到的   DeepSeek、夸克和豆包,正是三类工具的代表产品。

AI   工具的 " 三国时代 ",已经悄悄开始了。

天下三分

说   2025   年是   AI   元年一点都不夸张。

QuestMobile 的数据,截至 2025 年 2 月,AI 原生 App 月活跃用户(MAU)突破 2.4 亿,较去年同期净增超 1.15 亿,也就是说已经有接近   2.5   亿的人接触过   AI   工具。

在商业领域,行业数据显示,2024 年中国 AI 核心产业规模达 5784 亿元,同比增长 13.9%;到了   2029   年,这两个数字还会分别攀升至   1   万亿元和 32.1%。

说   DeepSeek、夸克和豆包三分天下,三款软件都拥有   Top   级别的月活是一大原因。

DeepSeek 是国内 AI   原生 App   排名第一的软件,今年   3   月的数据显示月活能达到   1.94   亿;夸克也不遑多让,同期月活达   1.48   亿,去年暑期时夸克的峰值月活更是接近   2   亿;豆包则经历了月活的暴增,从   2024   年的   173   万增长至今年   3   月的   1.1 亿,增速达到了   35   倍。

另一方面,在技术路线、应用场景上三个软件刚好又 " 泾渭分明 "。DeepSeek、豆包和夸克,分别代表了底层技术突破、用户体验重构和产业场景深耕三个维度,勾勒出中国 AI 工具的立体化发展脉络。

三条路线,三个方向

相信天天都在用这三款软件的人不少,但大家有没有想过,为什么夸克豆包没有像   DeepSeek   一样擅长逻辑推理?

夸克的   AI   搜索功能结果,为什么会和 DeepSeek   搜出来的有明显的区别?

这正是   DeepSeek、夸克和豆包代表着中国   AI   工具三条不同发展路线的具体表现。

先说大家很熟悉的   DeepSeek。

DeepSeek 作为中国 AGI 领域的代表,其核心竞争力体现在通用大模型的研发与开源生态构建,他们和其他 AI 厂商最大的不同在于专注于底层技术突破,而非商业化。

虽然也有传统模型产品   V3,但在今天提起   DeepSeek   大家最先想起的肯定是推理模型   R1。

既然是「推理模型」,推理能力自然是 R1   的优势,它在数学推理、代码生成和复杂任务处理上实现了突破性进展,数学任务上的性能可与 OpenAI 的 O1 相媲美。

传统大模型在回答同类型问题时,更容易遇到知识精细度不足与领域适配困难、复杂推理能力缺失、算力消耗与部署成本过高等问题,这都被   DeepSeek R1   一一解决了。

其中的关键是,DeepSeek R1   可以依靠混合专家架构(MoE)实现效率跃升,以强化学习突破数据依赖,借开源生态加速场景渗透,解决数学推理、复杂任务处理场景的各种问题。

技术架构上,强化学习驱动的高效推理带来了大模型训练的 " 规模效应 " 革命,对 MoE 架构进行优化,相比传统全参数模型降低 30% 的算力消耗,回答专业领域问题时延迟更低,实现 " 小力出奇迹 "。

当然更加惊艳世人的是   DeepSeek R1   首次以长链逻辑与思维可视化的方式,展现了推理模型的特性,它也是全球首个展示完整推导过程的推理模型。

在推理能力的加持下,R1   的复杂任务分解能力大大提升,可逐步拆解跨领域问题。比如在解答高考数学题时,R1 会逐步呈现概率计算路径,而传统模型只会直接输出最终结果,用户也可以从推理过程中找出模型的思考漏洞并进行改进。

DeepSeek 的技术路线,决定了它更擅长自然语言处理和复杂推理类的问题,在代码生成和编程辅助上也展现出了极强的能力。特别对金融、银行和科研机构来说,DeepSeek   的出现能大大增加数据分析的效率,也算是掀起了一股产效比革命。

而且这种技术路径不仅提升了模型的泛化能力,还通过 MIT 开源协议降低了开发者的使用门槛,推动 AI 技术的普惠化。

从行业趋势看,DeepSeek 的发展与《2025 中国 AIGC 应用全景图谱报告》中提到的 " 模型层关键趋势 " 高度契合。

报告提到,中国大模型的竞争正从 " 技术有无 " 转向 " 代差级领先能力 ",而 DeepSeek 通过混合专家系统(MoE)和多模态技术突破,在模型深度推理能力上确实建立了差异化优势,还成为了全世界学习的对象。

此外,深度求索主张的开源策略与国内厂商 " 协作创新 " 的趋势一致,现在还有自称 AI   工具的软件没接入   DeepSeek   吗?

DeepSeek,伟大。

然后来谈谈夸克。

夸克和   DeepSeek   的最大不同之处在于,DeepSeek   的网页搜索功能是一种辅助功能,夸克则把   AI   搜索作为了工具的核心。

阿里在定义夸克的时候,将这称为 "AI 与行业场景的深度融合 "。

阿里对夸克的期望很高,把它定位为「AI 普惠平台」:以 "2 亿人的 AI 全能助手 " 为品牌核心,依托阿里生态实现 " 搜索 + 生成 " 双向增强,确立了 "AI+ 搜索 ""AI+ 办公 ""AI+ 教育 " 三大主线。

阿里在打造   AI   时代的夸克时,在 " 提升搜索效果 " 上下了非常大的功夫,所以今天的夸克,是这样的:

能搜到几秒前发生的大新闻。夸克可以依托阿里云通义大模型与搜索生态的深度融合,实现   10   秒每次的更新频率,抓取新消息的延迟也降低到了   3   分钟以内。

弄了一个「超级框」。夸克将将 AI 对话、深度搜索、内容生成(PPT、文案)、学术研究等功能全塞了进去,它有点像过去的 " 百度一下 ",不需要分门别类,简化了用户在搜索时的思考成本和操作逻辑。

拥有相对更低的   AI   幻觉。夸克设置了三审三校机制,医疗、法律等专业领域生成需经行业专家审核,结合知识图谱校验,据称可以将医疗问答错误率控制在 5% 以下。

从结果来看,避开   DeepSeek   和豆包等软件的锋芒,主攻   AI   搜索的夸克是成功的。每月拥有   1.5   亿上下的月活基本奠定了它在   AI   搜索工具的龙头地位,并在去年高考期间靠着填报志愿、成绩分析、职业规划等功能狠狠出圈。

为了助力夸克成功,阿里也是费尽心思。夸克   AI   能力依托于阿里的心血结晶:通义千问大模型。

虽然是一款基于 Transformer 和 MoE 架构的、不时髦的非推理类传统大模型,但能力还真挺行。

实际上根据基准测试平台 Chatbot Arena 的评测榜单,通义 Qwen2.5-Max 超越 DeepSeek-V3、Open AI o1-mini 和 Claude-3.5-Sonnet 等模型,以 1332 分位列全球第七名,是中国非推理模型中最强的。

具体来看,Qwen2.5-Max 在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。

而在 LMArena 的盲测榜单中,Qwen2.5-Max   的数学推理(如 MMLU-Pro、LiveCodeBench)和硬提示(Hard prompts)处理能力分别位列全球第 1 和第 2,超越 DeepSeek-V3(排名第 8)。

夸克正是从通义千问力得到了文本、图片、音频、视频联合解析的多模态融合能力,在一些需要逻辑推理的场景中也可以发挥通义千问数学能力强的优点。

或许对轻量化浏览器出生的夸克来说,延续 " 浏览器 " 这一历史定位,从搜索路线切入   AI   的   C   端,期待成为 DeepSeek、豆包这样的国民级软件,已经是最好选择。

最后,是今天开头那则小故事的主角:火山引擎的豆包

实际上,可能对大多数的用户来说,豆包更加符合他们对   AI   工具的认知。能吟诗作对、能画画做视频,为用户改文案,生成某些平台专属的风格文案…

字节对豆包的定位是 " 全民 AI 入口 ",主攻消费级市场,创意生成和社交娱乐是它的最大卖点,多模态交互是整个工具的灵魂。

豆包代表了中国 AI 工具在 C 端场景的深度渗透。比起   DeepSeek 它功能更多;比起夸克,它生图效果更好。

如果你觉得豆包不行,字节还为它安排了两个马仔打手保驾护航:即梦   App 主打轻量级的视频和图片生成,可灵则面向专业级的企业用户。

再依托字节的流量生态,AI   产出的视频素材直接给到短视频平台使用,图片素材可以同步到飞书上作为插图,美美实现生态闭环。

为了实现这些创意生成效果,过去豆包   AI 依靠 Transformer 与扩散模型结合的基础架构,结合语音 - 文本联合建模和视觉生成技术的多模态技术融合,为用户提供多模态功能。

4 月 17 日,豆包发布了全新的 1.5 深度思考模型,采用了   MoE   架构,总参数   200B、激活参数   20B。

在继续提高多模态能力的同时,豆包 1.5   强化了模型的数学、编程、科学和推理能力,测试表现甚至超过 DeepSeek-R1、QwQ-32B 等国产推理模型,与 OpenAI o1、o3-mini-high 等模型能力相仿。

随着架构优化、资源分配优化和推理效率的提升,深度思考大模型让豆包的图片生成、视频生成能力进一步升级,不仅支持了 " 边想边搜 "、" 视觉理解 " 等实用能力,豆包文生图   3.0   也将生成图片的最大分辨率提高到了   2k   级别。

依托字节系应用的海量流量,豆包预计还能持续在月活上创新高。哪怕在创意生成的绝对水准方面还没有达到   GPT-4o   的高度,但作为一款使用门槛低、上手简单的国产   AI   软件,豆包完全还可以美美地偏安一隅。

最终,DeepSeek 代表的通用大模型、豆包代表的消费级应用、夸克代表的行业解决方案,构成了 "基础研究 - 场景落地 - 生态协同" 的完整链条。

三个   AI   工具都已经各自抢好赛道。夸张点说,只要你需要用   AI   工具,就绕不开上面三个软件里的任意一个。

AI  围城

回过头来,还是不胜唏嘘。去年的今天,主流的   AI   工具搜索的内容、生成的文字都几乎处于不可用状态,当时也不会有人想在工作上用   AI   工具作为辅助,毕竟大概率是会帮倒忙的。

但一年之后,我们身边涌现了各种各样的   AI,不仅查资料的丰富程度、准确程度大幅度提高,AI   制作的头图、插图已经司空见惯。从   DeepSeek   平地惊雷的那一刻起,我们的生活就被深深改变了。

就是,这也不完全是一件好事。

AI   工具泛滥的一大问题是   AI   幻觉问题日益严重,比如大家信赖的   DeepSeek R1,偏偏是众多工具中   AI   幻觉偏高的;其他的   AI   软件虽说各种手段降低了幻觉率,但其实也没好到哪去。

在一部分的测试中,  R1   的事实性测试幻觉率高达 22.33%,更糟的是一些由幻觉产生的 "AI 胡说八道 " 又会成为语料,重新喂回给   AI,形成恶性循环,最终把整个中文互联网都污染了。

哪怕你不用 AI,也不知道网上哪些是由   AI   编造的假信息。

|又是一次言之凿凿的胡说八道

另外,开头那个关于豆包的新闻,总让人止不住担忧:老人家宁愿向   AI   告别,也不愿意和家人倾诉。

毕竟远在大洋彼岸的美国,一年前有一位名叫 Sewell Setzer   的弗罗里达州男孩,在聊天机器人程序   Character.ai 的 " 怂恿 " 下选择自杀,年仅   14   岁。现在他的家人还和   AI   软件的公司打着官司,这是一宗 " 人类和   AI   走得太近 " 引发悲剧的典型案例。

当   AI   越来越智能,聊天机器人越发像人,我们就像身处由   AI   构筑的围城里。把作品、言论、思想喂给   AI   作为语料,把最后的心情、感觉、心愿留给   AI,会不会终有一天,人类变得和   AI   太 " 亲近 ",又和人类太 " 疏远 "?

在这   AI   三国鼎立的一刻,人类和人工智能之间的关系,开始慢慢变得微妙起来。

历史文章

Review

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 百度 旅游攻略 元和 用户体验
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论