OpenAI反诉马斯克，英伟达对华芯片调整解禁

OpenAI

ChatGPT 上线 " 完整记忆 " 功能

4 月 10 日，OpenAI 宣布 ChatGPT 正式上线全局记忆功能，这项新能力不仅保留历史聊天记录，还支持在回答中主动引用以往信息，相当于将用户对话转化为 " 知识库 "，提供更具个人化的交互体验。

该功能目前面向 Plus 和 Pro 用户，Team、企业和教育版用户需再等几周。

小面君：这不妥妥 "AI 界的初恋 " ——第一次见面就记住你所有喜好。就怕哪天分手（删号）时，黑历史会被 AI 写成回忆录。

OpenAI 反诉马斯克

当地时间 4 月 9 日，OpenAI 正式向加州联邦法院提交反诉状，指控前联合创始人埃隆 · 马斯克 " 系统性干扰公司运营 "，包括通过社交媒体攻击（X 平台 2 亿粉丝）、发起骚扰性诉讼、提出虚假收购要约等行为，并要求法院禁止其继续干预公司治理并赔偿损失。

此前，马斯克曾于 2024 年起诉 OpenAI" 背弃非营利初心 "，并要求阻止其转型为营利实体。

小面君：这场 AI 界的 " 宫斗剧 " 跌宕起伏。到底马斯克能不能继续搅局，OpenAI 又能否顺利 " 维权 "，更重要的是，OpenAI 能否在年底前完成营利转型拿到软银 300 亿美金，大家都搬好小板凳等着看这场大戏的结局呢。

OpenAI 拟斥资 5 亿美元收购 Jony Ive 的 AI 设备公司

4 月 7 日，据 The Information 援引知情人士透露，OpenAI 近几周曾讨论以不低于 5 亿美元（约合人民币 36.41 亿元）的价格，收购由 OpenAI CEO 萨姆 · 奥特曼（Sam Altman）与前苹果首席设计官乔纳森 · 伊夫（Jony Ive）合作成立的 AI 公司。

据媒体此前报道，这家公司计划开发一款由 AI 驱动的个人设备，被外界称为 "AI 时代的 iPhone"。

小面君：奥特曼试图用硬件破局交互入口，但硬件赛道如今水深火热不说，他还有个烧钱的大模型主战场要守。

谷歌

谷歌发布 Gemini 2.5 Flash AI 模型

在 4 月 9 日的 Google Cloud Next 2025 大会上，谷歌正式发布了 Gemini 2.5 Flash。

Gemini 2.5 Flash 是一款推理模型，强调快速和高性价比，为开发者提供了支持高达 100 万 tokens 的上下文处理能力，使模型在面对复杂对话时依然能够精准回应，展现了其在自然语言处理上的优异性能。该模型能够根据对话任务的复杂程度动态调整推理深度，从而有效控制计算成本。

小面君：这价格比 DeepSeek R1 还便宜？明摆着要抢中小企业的芳心，但藏着掖着不发布安全报告，怕是玩 " 先上车后补票 "？

谷歌宣布开源首个智能体交互协议

当地时间 4 月 9 日，谷歌在 Google Cloud Next25 大会上推出 Agent2Agent 协议 ( A2A ) ，这是一项全新的开放标准，旨在让 AI 智能体能够相互通信。此前，Anthropic 的模型上下文协议 ( MCP ) 为智能体提供了一种结构化的工具使用方式，而 A2A 则为智能体提供了一种相互协作的方式，将孤立的机器人转变为数字工作团队。

小面君：谷歌这是搞了个 " 智能体安卓系统 " 啊，这协议要是成了，未来 HR 的招聘 Agent 能自动背调 + 谈薪 + 发 offer，打工人连 " 已读不回 " 的机会都没了。

谷歌发布第七代张量处理器 ( TPU ) Ironwood

在 4 月 9 日 Google Cloud Next 25 大会上，谷歌推出了第七代 TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计，是谷歌迄今为止性能最强的 TPU。

Ironwood 最高配集群可拥有 9216 个液冷芯片，峰值算力 42.5 ExaFlops，也就是每秒运算 42500000000000000000 次。

小面君：有了这么厉害的芯片，谷歌在 AI 领域的底气更足，就看能不能借此拉开和竞争对手在应用性能上的差距了。

谷歌在 TED 上展示新款 AR 眼镜和 VR 设备

当地时间 4 月 10 日，谷歌在加拿大温哥华举行的 TED Humanity Reimagined 大会（TED 2025）上展示了新款 AR 眼镜和 VR 设备。

此次展示的 AR 眼镜原型搭载了微型显示屏与 Gemini AI 助手，可实现实时翻译、物体定位、书籍扫描等功能，并与手机协同处理数据以降低硬件负荷。

同时，谷歌还演示了与三星合作开发的 MR 头显 " 无限 "（Infinite），该设备基于 Android XR 系统，支持空间交互与沉浸式体验。

小面君：谷歌眼镜曾上演 " 出道即退圈 " 的悲剧，这次能否打破 " 硬件魔咒 "，得看用户愿不愿意顶着 " 赛博算命先生 " 造型出门。

苹果

苹果 Siri 告别封闭开发

The Information4 月 10 日报道，苹果公司已重大调整 Siri 的开发策略。在 Craig Federighi 的领导下，苹果工程师首次获准使用第三方大语言模型（LLMs）开发 Siri 功能，打破以往只能使用内部模型的限制。

报道指出在过去，苹果严格要求工程师仅使用自研大语言模型开发 Siri 功能。管理层于 2023 年明确禁止将 OpenAI ChatGPT 等外部模型融入最终产品。

小面君：果粉们再也不用忍受 Siri" 人工智障 " 式应答了！但苹果自研模型被曝效果垫底，这波开放究竟是 " 拥抱生态 " 还是 " 技术认怂 "？库克的笑容里藏着多少无奈。

Meta

Meta 回应 Llama 4" 刷分 " 质疑

4 月 7 日，Meta 的生成式 AI 负责人 Ahmad Al-Dahle 在社交平台上发布了一篇长文，回应了对于 Llama 4 的质疑。

Ahmad 表示，由于 Llama 4 刚开发完就迅速发布，所以模型 " 在不同服务中表现出了参差不齐的质量 "，公司会尽快修复漏洞。同时，Ahmad 否认了 Llama 4 在训练集中作弊 " 刷分 " 的说法。

小面君：Llama 4 若想对标 GPT-4，光靠嘴硬可不够，得学学 DeepSeek 用访问量说话。

英伟达

英伟达对华芯片调整解禁，H20 芯片获准继续在华销售

4 月 9 日，据美国国家公共电台报道，特朗普政府已调整对英伟达的出口限制政策。在首席执行官黄仁勋上周出席海湖庄园晚宴后，英伟达专为中国市场设计的 H20 人工智能芯片获准在中国市场销售。

消息人士透露，美国原计划对这类芯片实施出口管制——相关措施已筹备数月，原定于本周生效。值得注意的是，在英伟达承诺向特朗普政府增加对美国人工智能数据中心的投资后，政策方向出现转变。

小面君：看来黄仁勋的海湖庄园晚宴，吃出了价值千亿的 " 芯片外交 "。

英伟达开源新模型，性能直逼 DeepSeek-R1

4 月 7 日晚，英伟达开源了一款名为 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型。该模型基于 Meta 早期的 Llama-3.1-405B-Instruct 模型开发，拥有 2530 亿个参数，在多项第三方基准测试中表现出色：

值得关注的是，英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1，但只用了不到一半的参数量。

测试结果显示，GPQA（76 vs. 71.5）、IFEval 指令遵循（89.5 vs. 88.8）和 LiveCodeBench 编码任务（66.3 vs. 65.9）。并且，Llama-3.1-Nemotron-Ultra-253B 推理吞吐量也比 DeepSeek R1 671B 高 4 倍。

但在 MATH500 和 Arena Hard 基准测试中，DeepSeek R1 仍略占优势。

小面君：黄仁勋这是把 " 暴力美学 " 玩出了新境界。只是当开源大模型开始军备竞赛，到底是在卷技术，还是在给自家 GPU 清库存？

英伟达完成收购 Lepton AI，阿里前副总裁贾扬清团队加盟

据 The Information 于 4 月 8 日援引知情人士消息，英伟达已完成对阿里前副总裁贾扬清创企 Lepton AI 的收购，贾扬清及 Lepton 另一联合创始人白俊杰均已加入英伟达。

Lepton AI 成立于 2023 年，是贾扬清在离开阿里之后创办的 AI Infra 公司，主要业务是出租英伟达 GPU 服务器，开发软件帮助创企在云中构建和管理自己的应用。

小面君：这买卖血赚！Lepton 的 " 多云拼图 " 技术 + 英伟达的 CUDA 生态，英伟达 "AI 军火商 " 秒变 " 云计算包工头 "。

百度

文心大模型 4.5 Turbo 将于 4 月 25 日发布

百度宣布将在 4 月 25 日的 Create 大会上发布文心大模型 4.5Turbo，尽管具体细节尚未披露，但业界对此充满期待。文心大模型 4.5 及文心大模型 X1 已于上月发布并向用户免费开放，展现了百度在 AI 领域的深厚积累。文心大模型 4.5 在多模态理解能力上表现卓越，API 调用价格极具竞争力，吸引了众多开发者和企业的关注。

小面君：百度这 " 月更狂魔 " 人设稳了，眼看着要把国产模型 " 价格屠夫 " 的帽子焊死在头上了。

阿里

阿里云造 "Agent 工厂 "，百炼 MCP 服务上线

4 月 9 日，阿里云在北京召开 "AI 势能大会 "，宣布于阿里云百炼平台上线业界首个全生命周期 MCP 服务。该服务无需用户管理资源、开发部署、工程运维等工作，5 分钟即可快速搭建一个连接 MCP 服务的 Agent（智能体）。

百炼平台首批上线了高德、无影、Fetch、Notion 等 50 多款阿里巴巴集团和三方 MCP 服务，覆盖生活信息、浏览器、信息处理、内容生成等领域，可满足不同场景的 Agent 应用开发需求。

小面君：这哪是 AI 开发？简直是 " 科技乐高 "，中小企业也能玩转智能体。但别高兴太早——阿里生态绑定越深，未来想跳船成本越高。

阿里智能 AI 眼镜或于 2025 年底发布

4 月 7 日，据维深信息 Wellsenn XR 深夜爆料，阿里已正式敲定 AI 智能眼镜项目方案，并正加速招聘和扩充团队，预计将于 2025 年底发布。

同时爆料称，该项目由智能信息事业群天猫精灵团队主导，硬件规格将超越 Ray-Ban Meta 智能眼镜，并将分为两个版本，不带显示的 AI 智能眼镜，以及带显示的 AI+AR 智能眼镜，后者优先级更高。

此外，AI 功能方面，基于通义大模型技术，眼镜还将深度整合阿里 AI 旗舰应用 " 夸克 " 的 "AI 超级框 " 体验。

小面君：想象一下，眼镜一扫商品比价全网最低，这波 " 价格屠夫 " 技能，李佳琦看了都颤抖！

字节跳动

豆包开源多语言代码修复基准

4 月 10 日，字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集—— Multi-SWE-bench，可用于评估和提升大模型 " 自动修 Bug" 能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向 " 全栈工程 " 的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

小面君：从 Python 到多语言，代码修复能力成为大模型技术新战场。字节跳动此举能否催生 " 代码修复界的 GPT"？

Anthropic

Anthropic 推出 200 美元 Claude 聊天机器人订阅套餐

4 月 9 日，Anthropic 宣布一项新的 Max 订阅计划，根据使用情况每月收费 100 美元或 200 美元。与目前每月 18 美元的 Pro 套餐相比，100 美元的套餐将使用户能够向 Claude 聊天机器人发送 5 倍的查询量，而 200 美元的套餐则将提供 20 倍的查询量。

Anthropic 称，一般而言，付费 Pro 用户在 5 个小时内至少可以向 Claude 发送 45 条信息。

小面君：这定价堪比 AI 界的爱马仕，打工人摸摸钱包选择白嫖 Gemini ——谷歌笑醒在厕所。

其他

Kimi 开源轻量级视觉语言模型

4 月 10 日，月之暗面 Kimi 宣布开源两款轻量级视觉语言模型 Kimi-VL 和 Kimi-VL-Thinking。这两款新模型采用 MoE 架构，支持 128K 上下文，激活参数仅约 30 亿，在多模态推理能力上显著超过 10 倍大小的大模型。

商汤科技发布 " 日日新 V6" 多模态大模型

4 月 10 日，商汤发布新一代 " 日日新 SenseNova V6" 大模型系列。SenseNova V6 包含若干个版本，以满足不同场景的需要。其中，SenseNova V6 Pro 为原生多模态通用大模型，其采用 6200 亿参数的混合专家架构，实现文本、图像和视频的原生融合，在纯文本和多模态任务上都表现出优秀的综合性能。

2025 年全国大模型算法备案奖励补贴政策发布，最高可达 5000 万元

北京、上海、广东、浙江等地出台激励措施，涵盖大模型备案、算法备案、算力补贴、房租减免、研发奖励、企业营收晋级奖励等。

杭州市对参数量达千亿级的通用大模型给予最高 5000 万元训练成本补助；其他地区也有上千万元的补贴额度。多地将大模型或算法在国家网信办完成备案作为前提，鼓励企业规范合规发展的同时，加大对 AI 创新的扶持力度。

亚马逊推出全新 AI 语音模型 Nova Sonic，叫板 OpenAI 和谷歌

亚马逊近日发布了新一代生成式 AI 模型 Nova Sonic，这是一款能够原生处理和生成自然流畅语音的模型。Nova Sonic 在速度、语音识别和对话质量等方面表现出色，与 OpenAI 和谷歌的前沿语音模型不相上下。亚马逊声称，Nova Sonic 是市场上 " 最具成本效益 " 的 AI 语音模型，其价格比 OpenAI 的 GPT-4o 便宜约 80%。

Nova Sonic 的一大亮点是其语音识别能力。在多语言 LibriSpeech 基准测试中，该模型在英语、法语、意大利语、德语和西班牙语上的平均单词错误率仅为 4.2%，即每 100 个单词中仅 4 个出错。

欧盟计划斥资 200 亿欧元建设 AI 超级工厂

当地时间 4 月 9 日，欧盟公布了一项 200 亿欧元 AI 建设计划的细节，该计划将在欧洲建立配备大型超级计算机的新站点，以开发下一代人工智能模型。欧盟官员计划在欧盟内建设三至五座人工智能超级工厂，每座耗资约 30 亿至 50 亿欧元。欧盟文件称，目前性能最好的 AI 工厂拥有配备多达 25000 个先进 AI 处理器的超级计算机，但超级工厂目标是拥有超过 100000 个 AI 处理器。

美银：目前超过 90% 的员工都在使用 AI

4 月 8 日，美国银行表示，其 AI 计划已取得成效，其 213000 名员工中的大多数都在使用公司的虚拟助手或其他形式的 AI。美银表示，通过回答员工的问题，员工助理 Erica 将 IT 帮助台的呼叫量减少了一半以上。目前超过 90% 的员工都在使用 Erica。美银还在 Merrill Lynch、私人银行和呼叫中心等领域推出了生成式 AI，以帮助顾问和银行家回答问题、起草客户备忘录，并为客服代表生成通话摘要。

宙世代

一起剪

相关标签