阿里千问向第三方 Agent、Skill 全面开放;酷哇科技发布CooWAIM 2.0交互式世界模型;智元开源行业首个聚焦物理交互的具身数据集

—— ·要点速览· ——

1、微软全面押注智能体时代：发布新模型、展示新终端、重塑应用生态

2、酷哇科技发布 CooWAIM 2.0 交互式世界模型

3、消息称字节 Seedance 2.0 模型单月营收已超 10 亿元，且仍在爬升期

4、Soul App 开源端到端多人对话转录模型

5、阿里千问向第三方 Agent、Skill 全面开放，肯德基、瑞幸、蜜雪冰城、东航将首批接入

6、消息称 DeepSeek 计划在首轮融资中筹集约 70 亿美元，估值高达 590 亿美元

7、智元开源行业首个聚焦物理交互的具身数据集

8、阶跃 Step 3.7 Flash 冲入 OpenRouter Trending 前列

9、Anthropic 扩展最强 "AI 抓虫 "Claude Mythos 模型，三星等获准使用

10、中兴与腾讯将合作发布 WorkBuddy AI 云电脑

11、快手旗下可灵 AI 据悉正进行 Pre-IPO 轮融资，投前估值 180 亿美元

12、南方两倍做多海力士年内涨幅超 800% 规模突破 850 亿港元

更聚焦的科技行业交流群，捕捉每一条科技动态，诚挚邀请创业者、发烧友加入我们。微信扫码进群：

进群后，你有机会得到：

最新、最热的科技资讯；

最精准的行业资源对接；

论坛、沙龙、企业游学门票。

1、车载毫米波雷达系统解决方案提供商「楚航科技」完成 1 亿元 C 轮融资，由善达投资领投，江北新区科技投资集团、兰璞资本跟投。

楚航科技是一家车载毫米波雷达系统解决方案提供商，专注于 77/79GHz 高频段毫米波雷达的研发与产业化。主要从事车载角雷达、前向雷达、盲区检测系统及 4D 成像雷达等车规级产品的设计制造，产品用于实现 ACC、AEB、BSD 等高级辅助驾驶功能，为乘用车、商用车提供自动驾驶感知技术支持。

2、具身智能数据与模型基础设施提供商「Showee」完成数千万元天使 ++轮融资，由千乘资本领投，南山战新投、力合科创 ( 002243 ) 、华栋投资、英诺基金、Atom Capital等跟投

手亿科技 Showee 是一家具身智能数据与模型基础设施提供商，聚焦具身智能数据基础设施与下一代人机交互方案，专注于 " 低成本、高精度 " 的感知交互方案研发。公司核心技术源于清华大学自研的 " 视觉 ( Vision ) + 惯性 ( IMU ) " 融合感知方案。打造革命性的智能感知腕带。以独创的多模态手部感知算法为核心，构建具身智能的高质量数据底座，开启下一代人机交互范式。

3、AI 视觉机器人品牌「灵智未来 NEVO」完成数千万元Pre-A+ 轮融资，投资方为天空工场创投基金。

灵智未来 NAVO 是一家由追觅科技孵化的 AI 视觉机器人品牌，聚焦消费级安防摄像头领域，以 AI 算法为核心驱动力，致力于通过人工智能技术提升安防摄像头的感知能力、能效比和用户体验。公司核心产品包括 AI 安防摄像头系列和家庭具身智能机器人系列，其即将发布的家庭具身机器人产品矩阵，包括家庭大脑、双轮足看护机器人、宠物陪伴机器人、桌面陪伴机器人等。

4、AI+XR 虚拟直播解决方案提供商「创想数维」完成 2010 万元Pre-A 轮融资，投资方为创维投资 ( 00751 ) 。

创想数维是一家 AI+XR 虚拟直播解决方案提供商，聚焦 XR 虚拟技术研发与 AI 数字内容创作，专注于提供 AI+XR 虚拟直播与虚拟制作解决方案。创想数维已构建完整技术矩阵，推出 MetaBox 系列 AI+XR 虚拟直播解决方案，搭配 Coruscant 星核实时渲染系统与 Vormir 源行 AI 智能体，实现场景生成、实时渲染、内容制作全流程能力覆盖。公司核心产品包括面向直播电商、本地生活、企业营销的 MetaBox Studio 小型 AI+XR 虚拟直播间；以及面向专业创作、短剧拍摄、品牌营销的 MetaBox 4KK 专业级方案，支持 4K 级虚拟制作，显著提升效率、降低成本。

5、高危场景具身智能大脑开发商「旷新科技」完成数千万元Pre-A 轮融资，投资方为财通资本，国香资本。

旷行科技是一家高危场景具身智能大脑开发商，专注为高危工业工程领域（资源矿山、能源电力、油气化工、交通城建）提供 " 机器人 +AI 大脑 " 运维解决方案。公司核心能力不光是机器人在复杂工程场景下的移动控制，更多在于赋予机器人在高危作业，尤其是针对基建部分的 " 识别 + 诊断 + 处置 " 能力的 " 工程师大脑 "。

6、通用具身大模型研发商「千寻智能」完成 15 亿元A+ 轮融资。

千寻智能是一家通用具身大模型研发商，专注于构建机器人 " 通用大脑 "，通过研发通用具身大模型，赋予机器人跨场景的卓越泛化性与精细的物理交互能力，解决具身智能从虚拟到现实落地的核心难题。其产品运用了视觉语言模型 ViLa（Vision-and-Language Models）和部件约束模型 CoPa（Constraints of Parts）模型，作为具身智能机器人底层的多模态大模型，致力于打造行业领先的通用人形机器人和下一代具身大模型与学习算法。

7、量子计算与人工智能融合技术研发商「遂穿智元」完成股权投资，投资方为英诺基金，水木清华校友种子基金，蓝驰创投。

隧穿智元是一家量子计算与人工智能融合技术研发商，公司专注于量子计算软件、量子算法、量子人工智能（QAI）等核心技术的研发与应用，致力于为科研机构、金融、制药、材料科学等领域提供量子计算模拟、量子机器学习及行业解决方案，推动量子计算与经典计算的协同创新与产业化落地。

1、微软全面押注智能体时代：发布新模型、展示新终端、重塑应用生态

6 月 3 日消息，作为人工智能 ( AI ) 浪潮中的重要参与者，微软不仅提供关键的云基础设施和相关服务，还分别向 OpenAI 和 Anthropic 投入数十亿美元的资金。如今，这家科技巨头正进一步发力，试图在自研 AI 模型领域与行业领先者展开竞争。

当地时间周二，在于旧金山举行的 Build 开发者大会上，微软发布了其首款代码生成模型—— MAI-Code-1-Flash。该模型能够根据用户输入的自然语言描述，自动生成应用程序和网站的源代码。目前，该模型已集成至 GitHub Copilot AI 编程助手以及 Visual Studio Code 编辑器中。

近年来，AI 编程市场迅速升温。开发者乃至没有编程背景的普通用户，都可以通过文本提示词快速构建复杂的软件产品。

对于微软而言，推出自有模型还具有明显的经济意义。随着使用领先大模型的成本不断攀升，微软若能向开发者提供自主研发的模型，便能够直接运行于自家的 Azure 云基础设施之上，从而避免向 OpenAI 等第三方支付费用。

今年 5 月，谷歌也发布了能够执行编程及其他任务的 Gemini 3.5 Flash 模型，并将其部署在自身的数据中心运行。

除 MAI-Code-1-Flash 外，微软此次还推出了一款推理模型—— MAI-Thinking-1，并重点强调两款模型在效率方面的优势。

微软开发者营销负责人兼 GitHub 运营主管 Kyle Daigle 表示，MAI-Thinking-1 是一款中等规模的推理模型，其设计目标是在保持高性能和高效率的同时，实现更低的 Token 使用成本。

随着 OpenAI 和 Anthropic 持续保持高速增长并向资本市场迈进，微软正试图在 AI 产业链的更多环节占据主动地位。

Anthropic 周一宣布，已秘密提交 IPO 申请文件；而 OpenAI 也正在推进 IPO 计划，最快可能于今年启动上市进程。

微软此前已向 OpenAI 投资 130 亿美元，并向 Anthropic 投资 50 亿美元，同时通过 Azure 云平台向客户提供两家公司开发的 AI 模型服务。

目前，MAI-Thinking-1 已通过微软 Foundry 平台开放私人预览。Foundry 是微软帮助企业将 AI 模型集成到应用程序中的开发平台。客户现可申请参与测试，并在模型正式全面开放前提前体验。

微软表示，用户还可以将自身专有数据接入 MAI-Thinking-1，以进一步提升模型推理结果的准确性。

微软首席执行官萨提亚 · 纳德拉在大会现场表示：" 刚刚展示的内容代表着一次相当重大的转变。我们相信，企业不应再只是单纯消费前沿模型，而应当全面参与到前沿模型生态系统的建设之中。"

微软 AI 业务负责人 Mustafa Suleyman 则透露，在针对管理咨询公司麦肯锡的业务需求进行专门优化后，微软相关模型的表现已经超过 OpenAI 的 GPT-5.5，同时实现了高达 10 倍的成本效率提升。

与此同时，微软还发布了新一代云端 AI 模型，涵盖语音识别、语音合成以及图像生成等领域。此外，公司还推出了可直接运行于 Windows 个人电脑上的轻量级 Aion 系列模型。

以 Windows 操作系统和办公软件闻名的微软，周二还释放出一个重要信号：未来的新一代智能设备或将不再依赖传统应用程序 ( App ) ，而是由能够自主完成特定任务的 AI 智能体驱动，重点应用于医疗、零售等行业场景。

微软高管公布了一项名为 Project Solara 的新项目。该项目包含一系列原型设备，尺寸从智能音箱大小到工牌徽章大小不等，采用来自高通和联发科的芯片方案。

这些设备配备显示屏和麦克风，但与智能手机不同，它们并不运行传统意义上的操作系统和应用程序。

微软现场演示显示，这些设备搭载 AI 智能体，通过连接云计算系统执行特定任务。例如，在医疗场景中，设备能够自动记录护士与患者之间的诊疗过程并生成文档。

微软同时宣布推出一款名为 Scout 的新型 AI 智能体。Scout 能够主动筛选电子邮件和消息，并自动整理出需要用户作出决策的事项，从而帮助用户提高工作效率。（科创板日报）

2、酷哇科技发布 CooWAIM 2.0 交互式世界模型6 月 3 日消息，酷哇科技近日发布 CooWAIM 2.0 交互式世界模型，基于 DAWN 架构，将世界预测器与动作降噪器置于隐空间联合训练，世界假设指导动作生成，动作假设反过来重塑世界推演，形成双向闭环，通过高效特征压缩将计算量降低约 75%。该模型已在酷哇 50 多个城市部署的万台级机器人上完成真机数据打磨，累计运营里程超 4500 万公里，可适配轮式底盘、四足机器狗、人形机器人等多种形态。（广角观察）

3、消息称字节 Seedance 2.0 模型单月营收已超 10 亿元，且仍在爬升期

6 月 3 日消息，据智能涌现今日消息，字节跳动火山引擎在今年 4 月已将 MaaS 业务营收目标上调至 150 亿元，且这个营收目标几乎每月都在上调。而在 2025 年底，这一目标还是 100 亿元。

在 2025 年，火山全年的 MaaS 收入约 15 亿元左右。等于截止目前2026 年的营收目标是去年实际营收的 10 倍。多位大厂人士透露，仅仅是Seedance 2.0 一个模型就可以为火山带来单月超过 10 亿元的收入，并且这一数字仍在爬升期。由于 Seedance 2.0 的 API 尚未在海外正式全量上线，这一数字是在市场有限的情况下达到的，火山对于 MaaS 业务的营收目标大概率会继续上调。

字节跳动于今年 2 月正式发布视频创作模型 Seedance 2.0，在多项指标上超越 Veo 3、Sora 2 等海外顶尖视频模型。

另据 Pandaily 上月报道，字节跳动正准备发布 Seedance 2.1 模型。知情人士透露，2.1 的生成质量比当前 2.0 版本提升了 20%。（IT 之家）

4、Soul App 开源端到端多人对话转录模型

6 月 3 日消息，据 Soul 官方消息，Soul App AI 团队（Soul AI Lab）联合西北工业大学音频语音与语言处理研究组 ASLP@NPU 团队及 Moonstep AI，正式开源端到端多人对话转录模型 SoulX-Transcriber。作为一款面向长音频、多说话人场景设计的语音理解模型，该模型能够直接从多人对话音频中生成包含时间戳、说话人身份和转录文本的结构化结果。（广角观察）

5、阿里千问向第三方 Agent、Skill 全面开放，肯德基、瑞幸、蜜雪冰城、东航将首批接入

6 月 3 日消息，阿里旗下千问 App 今日宣布，千问将向第三方 Agent、Skill 全面开放，所有企业均可在千问运营自己的品牌 Agent。

目前，瑞幸咖啡、肯德基、蜜雪冰城、东方航空等首批企业正在千问进行 Agent 服务测试，并将陆续上线。官方表示，未来企业可以在千问 App 中运营自己的 Agent，自定义 Agent 人设与服务边界，以对话的形式为用户提供各种形式的产品服务。

同时 Agent具备记忆与主动规划能力，可在特定场景下主动提供服务，如行程提醒、权益到期、复购推荐等。

东航 Agent 在深入理解用户出行计划和旅行偏好后，可针对旅客需求智能推荐行程方案，一站式解决出行服务；在瑞幸咖啡 Agent 上，还可主动告知用户 " 中午排队时间长，建议提前半小时点单 "（IT 之家）

6、消息称 DeepSeek 计划在首轮融资中筹集约 70 亿美元，估值高达 590 亿美元

6 月 3 日消息，据报道，DeepSeek 计划在首轮融资中筹集约 70 亿美元，估值高达 590 亿美元。腾讯与宁德时代将成为 DeepSeek 最大的外部投资者；网易和京东也计划参投。（创投家 CLUB）

7、智元开源行业首个聚焦物理交互的具身数据集

6 月 3 日消息，今天，智元正式开源 AGIBOT WORLD 2026 数据集第二期主题 " 多样交互（Rich Interaction）"。

据介绍，这是行业首个聚焦物理交互的开源具身数据集，面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究，系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程，旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。

官方称，本期 " 多样交互 " 数据集，是首次将具身智能的数据范式从 " 学习成功动作 " 推进到 " 理解完整的物理分布 "。唯有汲取真实而丰富的交互数据，机器人才能洞悉物理世界的运行法则。（IT 之家）

8、阶跃 Step 3.7 Flash 冲入 OpenRouter Trending 前列

6 月 3 日消息，阶跃星辰（StepFun）最新开源基座模型 Step 3.7 Flash 在发布 2 天后登上 OpenRouter Trending 全球第二位，成为近期全球开发者社区最受关注的开源模型之一。在社区分享的实测结果中，Step 3.7 Flash 在运行效率方面表现突出。有开发者将其与 DeepSeek V4 Flash、MiniMax M2.7 等同类模型进行对比后表示，Step 3.7 Flash 在速度与响应体验上展现出明显优势。与此同时，其工具调用能力也成为开发者关注的焦点。有开发者指出，Step 3.7 Flash 是目前首个能够稳定、准确且低成本完成 66 个工具调用测试的开源模型。（科创板日报）

9、Anthropic 扩展最强 "AI 抓虫 "Claude Mythos 模型，三星等获准使用

6 月 3 日消息，Anthropic 昨日（6 月 2 日）发布公告，宣布扩展 Project Glasswing 安全计划，向全球 15 个国家和地区、约 200 家组织开放 Claude Mythos 模型。

Glasswing 是 Anthropic 推出的安全计划，让科技公司使用其前沿 AI 模型 Claude Mythos Preview，来查找操作系统和网页浏览器中的安全漏洞。

该项目应用场景是企业级安全研究，核心是提供 AI 分析工具，辅助人类研究员更高效地审计代码与挖掘漏洞。

Claude Mythos Preview 于今年 4 月亮相，初期仅面向苹果等少数伙伴提供访问权限。现在 Project Glasswing 将新增约 150 家组织，合作名单预计增至约 200 家，并覆盖 15 个以上国家和地区。

Anthropic 为了降低高能力模型带来的安全风险，仍采用受控开放。公司称，新伙伴必须先满足安全要求，才能获得 Claude Mythos 访问权限。

据知情人士透露，获准使用 Mythos 系统的新国家包括加拿大、澳大利亚、新西兰、法国、德国、意大利、瑞士、荷兰、西班牙、比利时、瑞典、印度、日本和韩国等。

据《金融时报》报道，三星和 NATO 也可能进入新增合作名单。Anthropic 没有在原文中逐一披露完整名单，但提到通信和硬件相关公司在扩展后占比更高。（IT 之家）

1、中兴与腾讯将合作发布 WorkBuddy AI 云电脑

6 月 3 日消息，中兴通讯透露已与腾讯达成深度战略合作，将推出搭载腾讯原生 WorkBuddy 的 AI 云电脑。（广角观察）。

2、快手旗下可灵 AI 据悉正进行 Pre-IPO 轮融资，投前估值 180 亿美元

6 月 3 日，快手旗下视频生成大模型业务可灵 AI 正在进行分拆以来的首轮融资，投前估值为 180 亿美元。报道称，这是可灵 AI 的 Pre-IPO 轮融资，可灵 AI 目前内部按照 2027 年年初能够递交港股上市申报材料推进相关工作。 ( 新浪科技 )

3、南方两倍做多海力士年内涨幅超 800% 规模突破 850 亿港元

6 月3 号消息，今日韩国股市休市，但港股场内挂钩三星电子、海力士的杠杆产品二级市场价格依然走高。其中南方两倍做多海力士今日上涨 5.11%，年内涨幅高达 805.26%，规模突破 850 亿港元；南方两倍做多三星电子今日收涨 5.86%，年内累计涨幅 611.94%，规模达到 288.2 亿港元。（财联社）

制作门槛陡降，好内容的标准一分未减。

更多干货分享敬请注我们的公众号与视频号 ~ 超多精彩对话内容等待您的解锁！

宙世代

一起剪

相关标签