OpenAI
ChatGPT 上线 " 完整记忆 " 功能
4 月 10 日,OpenAI 宣布 ChatGPT 正式上线全局记忆功能,这项新能力不仅保留历史聊天记录,还支持在回答中主动引用以往信息,相当于将用户对话转化为 " 知识库 ",提供更具个人化的交互体验。
该功能目前面向 Plus 和 Pro 用户,Team、企业和教育版用户需再等几周。
小面君:这不妥妥 "AI 界的初恋 " ——第一次见面就记住你所有喜好。就怕哪天分手(删号)时,黑历史会被 AI 写成回忆录。
OpenAI 反诉马斯克
当地时间 4 月 9 日,OpenAI 正式向加州联邦法院提交反诉状,指控前联合创始人埃隆 · 马斯克 " 系统性干扰公司运营 ",包括通过社交媒体攻击(X 平台 2 亿粉丝)、发起骚扰性诉讼、提出虚假收购要约等行为,并要求法院禁止其继续干预公司治理并赔偿损失。
此前,马斯克曾于 2024 年起诉 OpenAI" 背弃非营利初心 ",并要求阻止其转型为营利实体。
小面君:这场 AI 界的 " 宫斗剧 " 跌宕起伏。到底马斯克能不能继续搅局,OpenAI 又能否顺利 " 维权 ",更重要的是,OpenAI 能否在年底前完成营利转型拿到软银 300 亿美金,大家都搬好小板凳等着看这场大戏的结局呢。
OpenAI 拟斥资 5 亿美元收购 Jony Ive 的 AI 设备公司
4 月 7 日,据 The Information 援引知情人士透露,OpenAI 近几周曾讨论以不低于 5 亿美元(约合人民币 36.41 亿元)的价格,收购由 OpenAI CEO 萨姆 · 奥特曼(Sam Altman)与前苹果首席设计官乔纳森 · 伊夫(Jony Ive)合作成立的 AI 公司。
据媒体此前报道,这家公司计划开发一款由 AI 驱动的个人设备,被外界称为 "AI 时代的 iPhone"。
小面君:奥特曼试图用硬件破局交互入口,但硬件赛道如今水深火热不说,他还有个烧钱的大模型主战场要守。
谷歌
谷歌发布 Gemini 2.5 Flash AI 模型
在 4 月 9 日的 Google Cloud Next 2025 大会上,谷歌正式发布了 Gemini 2.5 Flash。
Gemini 2.5 Flash 是一款推理模型,强调快速和高性价比,为开发者提供了支持高达 100 万 tokens 的上下文处理能力,使模型在面对复杂对话时依然能够精准回应,展现了其在自然语言处理上的优异性能。该模型能够根据对话任务的复杂程度动态调整推理深度,从而有效控制计算成本。
小面君:这价格比 DeepSeek R1 还便宜?明摆着要抢中小企业的芳心,但藏着掖着不发布安全报告,怕是玩 " 先上车后补票 "?
谷歌宣布开源首个智能体交互协议
当地时间 4 月 9 日,谷歌在 Google Cloud Next25 大会上推出 Agent2Agent 协议 ( A2A ) ,这是一项全新的开放标准,旨在让 AI 智能体能够相互通信。此前,Anthropic 的模型上下文协议 ( MCP ) 为智能体提供了一种结构化的工具使用方式,而 A2A 则为智能体提供了一种相互协作的方式,将孤立的机器人转变为数字工作团队。
小面君:谷歌这是搞了个 " 智能体安卓系统 " 啊,这协议要是成了,未来 HR 的招聘 Agent 能自动背调 + 谈薪 + 发 offer,打工人连 " 已读不回 " 的机会都没了。
谷歌发布第七代张量处理器 ( TPU ) Ironwood
在 4 月 9 日 Google Cloud Next 25 大会上,谷歌推出了第七代 TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的 TPU。
Ironwood 最高配集群可拥有 9216 个液冷芯片,峰值算力 42.5 ExaFlops,也就是每秒运算 42500000000000000000 次。
小面君:有了这么厉害的芯片,谷歌在 AI 领域的底气更足,就看能不能借此拉开和竞争对手在应用性能上的差距了。
谷歌在 TED 上展示新款 AR 眼镜和 VR 设备
当地时间 4 月 10 日,谷歌在加拿大温哥华举行的 TED Humanity Reimagined 大会(TED 2025)上展示了新款 AR 眼镜和 VR 设备。
此次展示的 AR 眼镜原型搭载了微型显示屏与 Gemini AI 助手,可实现实时翻译、物体定位、书籍扫描等功能,并与手机协同处理数据以降低硬件负荷。
同时,谷歌还演示了与三星合作开发的 MR 头显 " 无限 "(Infinite),该设备基于 Android XR 系统,支持空间交互与沉浸式体验。
小面君:谷歌眼镜曾上演 " 出道即退圈 " 的悲剧,这次能否打破 " 硬件魔咒 ",得看用户愿不愿意顶着 " 赛博算命先生 " 造型出门。
苹果
苹果 Siri 告别封闭开发
The Information4 月 10 日报道,苹果公司已重大调整 Siri 的开发策略。在 Craig Federighi 的领导下,苹果工程师首次获准使用第三方大语言模型(LLMs)开发 Siri 功能,打破以往只能使用内部模型的限制。
报道指出在过去,苹果严格要求工程师仅使用自研大语言模型开发 Siri 功能。管理层于 2023 年明确禁止将 OpenAI ChatGPT 等外部模型融入最终产品。
小面君:果粉们再也不用忍受 Siri" 人工智障 " 式应答了!但苹果自研模型被曝效果垫底,这波开放究竟是 " 拥抱生态 " 还是 " 技术认怂 "?库克的笑容里藏着多少无奈。
Meta
Meta 回应 Llama 4" 刷分 " 质疑
4 月 7 日,Meta 的生成式 AI 负责人 Ahmad Al-Dahle 在社交平台上发布了一篇长文,回应了对于 Llama 4 的质疑。
Ahmad 表示,由于 Llama 4 刚开发完就迅速发布,所以模型 " 在不同服务中表现出了参差不齐的质量 ",公司会尽快修复漏洞。同时,Ahmad 否认了 Llama 4 在训练集中作弊 " 刷分 " 的说法。
小面君:Llama 4 若想对标 GPT-4,光靠嘴硬可不够,得学学 DeepSeek 用访问量说话。
英伟达
英伟达对华芯片调整解禁,H20 芯片获准继续在华销售
4 月 9 日,据美国国家公共电台报道,特朗普政府已调整对英伟达的出口限制政策。在首席执行官黄仁勋上周出席海湖庄园晚宴后,英伟达专为中国市场设计的 H20 人工智能芯片获准在中国市场销售。
消息人士透露,美国原计划对这类芯片实施出口管制——相关措施已筹备数月,原定于本周生效。值得注意的是,在英伟达承诺向特朗普政府增加对美国人工智能数据中心的投资后,政策方向出现转变。
小面君:看来黄仁勋的海湖庄园晚宴,吃出了价值千亿的 " 芯片外交 "。
英伟达开源新模型,性能直逼 DeepSeek-R1
4 月 7 日晚,英伟达开源了一款名为 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型。该模型基于 Meta 早期的 Llama-3.1-405B-Instruct 模型开发,拥有 2530 亿个参数,在多项第三方基准测试中表现出色:
值得关注的是,英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1,但只用了不到一半的参数量。
测试结果显示,GPQA(76 vs. 71.5)、IFEval 指令遵循(89.5 vs. 88.8)和 LiveCodeBench 编码任务(66.3 vs. 65.9)。并且,Llama-3.1-Nemotron-Ultra-253B 推理吞吐量也比 DeepSeek R1 671B 高 4 倍。
但在 MATH500 和 Arena Hard 基准测试中,DeepSeek R1 仍略占优势。
小面君:黄仁勋这是把 " 暴力美学 " 玩出了新境界。只是当开源大模型开始军备竞赛,到底是在卷技术,还是在给自家 GPU 清库存?
英伟达完成收购 Lepton AI,阿里前副总裁贾扬清团队加盟
据 The Information 于 4 月 8 日援引知情人士消息,英伟达已完成对阿里前副总裁贾扬清创企 Lepton AI 的收购,贾扬清及 Lepton 另一联合创始人白俊杰均已加入英伟达。
Lepton AI 成立于 2023 年,是贾扬清在离开阿里之后创办的 AI Infra 公司,主要业务是出租英伟达 GPU 服务器,开发软件帮助创企在云中构建和管理自己的应用。
小面君:这买卖血赚!Lepton 的 " 多云拼图 " 技术 + 英伟达的 CUDA 生态,英伟达 "AI 军火商 " 秒变 " 云计算包工头 "。
百度
文心大模型 4.5 Turbo 将于 4 月 25 日发布
百度宣布将在 4 月 25 日的 Create 大会上发布文心大模型 4.5Turbo,尽管具体细节尚未披露,但业界对此充满期待。文心大模型 4.5 及文心大模型 X1 已于上月发布并向用户免费开放,展现了百度在 AI 领域的深厚积累。文心大模型 4.5 在多模态理解能力上表现卓越,API 调用价格极具竞争力,吸引了众多开发者和企业的关注。
小面君:百度这 " 月更狂魔 " 人设稳了,眼看着要把国产模型 " 价格屠夫 " 的帽子焊死在头上了。
阿里
阿里云造 "Agent 工厂 ",百炼 MCP 服务上线
4 月 9 日,阿里云在北京召开 "AI 势能大会 ",宣布于阿里云百炼平台上线业界首个全生命周期 MCP 服务。该服务无需用户管理资源、开发部署、工程运维等工作,5 分钟即可快速搭建一个连接 MCP 服务的 Agent(智能体)。
百炼平台首批上线了高德、无影、Fetch、Notion 等 50 多款阿里巴巴集团和三方 MCP 服务,覆盖生活信息、浏览器、信息处理、内容生成等领域,可满足不同场景的 Agent 应用开发需求。
小面君:这哪是 AI 开发?简直是 " 科技乐高 ",中小企业也能玩转智能体。但别高兴太早——阿里生态绑定越深,未来想跳船成本越高。
阿里智能 AI 眼镜或于 2025 年底发布
4 月 7 日,据维深信息 Wellsenn XR 深夜爆料,阿里已正式敲定 AI 智能眼镜项目方案,并正加速招聘和扩充团队,预计将于 2025 年底发布。
同时爆料称,该项目由智能信息事业群天猫精灵团队主导,硬件规格将超越 Ray-Ban Meta 智能眼镜,并将分为两个版本,不带显示的 AI 智能眼镜,以及带显示的 AI+AR 智能眼镜,后者优先级更高。
此外,AI 功能方面,基于通义大模型技术,眼镜还将深度整合阿里 AI 旗舰应用 " 夸克 " 的 "AI 超级框 " 体验。
小面君:想象一下,眼镜一扫商品比价全网最低,这波 " 价格屠夫 " 技能,李佳琦看了都颤抖!
字节跳动
豆包开源多语言代码修复基准
4 月 10 日,字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集—— Multi-SWE-bench,可用于评估和提升大模型 " 自动修 Bug" 能力。在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向 " 全栈工程 " 的评测基准。其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
小面君:从 Python 到多语言,代码修复能力成为大模型技术新战场。字节跳动此举能否催生 " 代码修复界的 GPT"?
Anthropic
Anthropic 推出 200 美元 Claude 聊天机器人订阅套餐
4 月 9 日,Anthropic 宣布一项新的 Max 订阅计划,根据使用情况每月收费 100 美元或 200 美元。与目前每月 18 美元的 Pro 套餐相比,100 美元的套餐将使用户能够向 Claude 聊天机器人发送 5 倍的查询量,而 200 美元的套餐则将提供 20 倍的查询量。
Anthropic 称,一般而言,付费 Pro 用户在 5 个小时内至少可以向 Claude 发送 45 条信息。
小面君:这定价堪比 AI 界的爱马仕,打工人摸摸钱包选择白嫖 Gemini ——谷歌笑醒在厕所。
其他
Kimi 开源轻量级视觉语言模型
4 月 10 日,月之暗面 Kimi 宣布开源两款轻量级视觉语言模型 Kimi-VL 和 Kimi-VL-Thinking。这两款新模型采用 MoE 架构,支持 128K 上下文,激活参数仅约 30 亿,在多模态推理能力上显著超过 10 倍大小的大模型。
商汤科技发布 " 日日新 V6" 多模态大模型
4 月 10 日,商汤发布新一代 " 日日新 SenseNova V6" 大模型系列。SenseNova V6 包含若干个版本,以满足不同场景的需要。其中,SenseNova V6 Pro 为原生多模态通用大模型,其采用 6200 亿参数的混合专家架构,实现文本、图像和视频的原生融合,在纯文本和多模态任务上都表现出优秀的综合性能。
2025 年全国大模型算法备案奖励补贴政策发布,最高可达 5000 万元
北京、上海、广东、浙江等地出台激励措施,涵盖大模型备案、算法备案、算力补贴、房租减免、研发奖励、企业营收晋级奖励等。
杭州市对参数量达千亿级的通用大模型给予最高 5000 万元训练成本补助;其他地区也有上千万元的补贴额度。多地将大模型或算法在国家网信办完成备案作为前提,鼓励企业规范合规发展的同时,加大对 AI 创新的扶持力度。
亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌
亚马逊近日发布了新一代生成式 AI 模型 Nova Sonic,这是一款能够原生处理和生成自然流畅语音的模型。Nova Sonic 在速度、语音识别和对话质量等方面表现出色,与 OpenAI 和谷歌的前沿语音模型不相上下。亚马逊声称,Nova Sonic 是市场上 " 最具成本效益 " 的 AI 语音模型,其价格比 OpenAI 的 GPT-4o 便宜约 80%。
Nova Sonic 的一大亮点是其语音识别能力。在多语言 LibriSpeech 基准测试中,该模型在英语、法语、意大利语、德语和西班牙语上的平均单词错误率仅为 4.2%,即每 100 个单词中仅 4 个出错。
欧盟计划斥资 200 亿欧元建设 AI 超级工厂
当地时间 4 月 9 日,欧盟公布了一项 200 亿欧元 AI 建设计划的细节,该计划将在欧洲建立配备大型超级计算机的新站点,以开发下一代人工智能模型。欧盟官员计划在欧盟内建设三至五座人工智能超级工厂,每座耗资约 30 亿至 50 亿欧元。欧盟文件称,目前性能最好的 AI 工厂拥有配备多达 25000 个先进 AI 处理器的超级计算机,但超级工厂目标是拥有超过 100000 个 AI 处理器。
美银:目前超过 90% 的员工都在使用 AI
4 月 8 日,美国银行表示,其 AI 计划已取得成效,其 213000 名员工中的大多数都在使用公司的虚拟助手或其他形式的 AI。美银表示,通过回答员工的问题,员工助理 Erica 将 IT 帮助台的呼叫量减少了一半以上。目前超过 90% 的员工都在使用 Erica。美银还在 Merrill Lynch、私人银行和呼叫中心等领域推出了生成式 AI,以帮助顾问和银行家回答问题、起草客户备忘录,并为客服代表生成通话摘要。
登录后才可以发布评论哦
打开小程序可以发布评论哦