半导体产业纵横 5小时前
边缘AI,何以成为大厂角逐的新沃土?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 |  半导体产业纵横,作者 | 方圆

在 AI 发展的进程中,早期云端 AI 凭借强大的算力与集中式的数据处理能力,成为行业发展的主导力量。但随着应用场景不断拓展,尤其是在物联网、自动驾驶、工业控制等领域,云端 AI 的局限性逐渐显现。国际数据公司(IDC)研究显示,2025 年全球边缘计算解决方案支出将接近 2610 亿美元,预计年复合增长率(CAGR)将达到 13.8%,到 2028 年将达到 3800 亿美元,零售和服务业将占据边缘解决方案投资的最大份额,占全球总支出的近 28%。这一数据直观体现出产业重心正从云端向边缘倾斜。

人们越来越担心人工智能正滑入泡沫领域。麻省理工学院 NANDA 项目发布的一份报告《GenAI 鸿沟:2025 年商业人工智能现状》发现,95% 的公司在开发生成式人工智能工具后几乎没有实现生产力提升。就连 OpenAI 首席执行官萨姆 · 奥特曼也承认,投资者可能对人工智能过度兴奋,并将当前的市场比作泡沫。

然而,业内人士认为,这种批评主要针对基于云端的人工智能市场和软件算法。

为什么需要边缘 AI 生成?

当前市面上主流的语言大模型,从 OpenAI 的 GPT、谷歌的 Gemini、Anthropic 的 Claude,到国内热门的 DeepSeek,几乎都依赖 AI 云计算完成生成任务。这种依托远程服务器的模式,凭借强大的算力,能轻松应对大规模模型训练、高分辨率图像合成等复杂需求,而且扩展性极强 —— 小到个人用户的日常问答,大到企业级的批量部署,都能灵活适配,对普通用户来说,这样的体验已经足够满足需求。

但放到企业级应用或更复杂的场景中,云端模式的短板就逐渐显现:一是延迟较高,复杂任务的响应速度容易受网络波动影响;二是对网络的依赖性极强,一旦断网便无法使用;最关键的是数据隐私风险—— 大量原始数据需要上传至云端处理,不仅会增加带宽成本,还可能因传输或存储环节的漏洞导致数据泄露,这对医疗、金融等敏感领域来说尤为棘手。

也正因此,边缘生成式 AI 的优势开始凸显。它将生成能力直接部署在本地设备上 —— 可能是我们的手机、监控摄像头,也可能是自动驾驶车辆、工业机床,数据处理全程在本地完成,敏感信息无需离开设备,从源头保障了隐私安全。与此同时,边缘 AI 的低延迟特性堪称 " 实时场景救星 ":自动驾驶需要毫秒级的路况判断、工业自动化依赖即时的设备故障预警,这些对响应速度要求极高的场景,边缘 AI 都能精准适配。更重要的是,它无需频繁传输数据,大幅降低了带宽需求,即便在无网络的偏远地区或信号薄弱的工业车间,也能独立运行,稳定性和可靠性远超云端模式。

边缘智能的技术雏形可追溯至 20 世纪 90 年代,当时以内容交付网络(CDN)的形态出现。其最初定位是通过分布在网络边缘的服务器,就近为用户提供网络服务与视频内容分发,核心目标在于分流中心服务器的负载压力,提升内容传输与访问效率。

不过,随着物联网(IoT)设备的爆发式增长,叠加 4G、5G 移动通信技术的普及,全球数据产生量呈指数级攀升,逐步迈入泽字节(ZB)时代。传统云计算架构在此背景下逐渐显露出短板:数据需全量传输至云端处理,不仅造成高额带宽消耗,还因传输距离导致高延迟问题,同时数据跨网络流转也带来了隐私泄露的风险,已难以满足实时性、安全性要求较高的场景需求。

进入 21 世纪后,为解决云计算的痛点,边缘计算概念正式提出。其核心思路是将数据处理环节从云端下沉至靠近数据源的边缘节点,通过在本地完成数据的初步筛选、处理与转发,大幅减少上传至云端的数据量,从而缓解带宽压力、降低延迟。但这一阶段的边缘计算,主要聚焦于数据处理流程的优化,尚未与人工智能(AI)技术结合,未涉及 AI 算法的部署与应用。

直到 2020 年以后,随着 AI 技术(尤其是轻量化模型、低功耗计算技术)的成熟,边缘计算与 AI 开始深度融合," 边缘智能 " 作为一门独立的融合技术正式兴起。它的核心特征是将 AI 算法(包括推理与训练环节)部署在靠近数据生成端的边缘设备(如物联网终端、边缘服务器)上,既能实现数据的实时处理与低延迟决策,又能避免原始数据上传云端,从源头保障数据隐私安全。

纵观边缘智能的发展历程,可清晰划分为三大核心阶段:第一阶段以 " 边缘推理 " 为核心,模型训练过程仍依赖云端完成,训练好的模型再被推送至边缘设备执行推理任务;第二阶段进入 " 边缘训练 " 阶段,借助自动化开发工具,实现模型训练、迭代、部署的全流程边缘化,减少对云端资源的依赖;第三阶段也是未来的发展方向,是 " 自主机器学习 ",目标是让边缘设备具备自主感知、自适应调整的学习能力,无需人工干预即可完成模型优化与能力升级。

当然,这并不意味着云端 AI 会被取代。面对超大规模模型训练、跨设备协同的复杂任务,云端强大的算力依然不可替代。未来的趋势更可能是 " 云端 + 边缘 " 互补:云端负责底层模型的训练与优化,边缘负责本地场景的实时部署与数据处理,二者协同发力,既能发挥云端的算力优势,又能兼顾边缘的隐私与实时性,最终推动人工智能技术更安全、更高效地走进各行各业。

数据来源:precedenceresearch 半导体产业纵横制表

市场研究机构 Market 数据表明,全球边缘人工智能市场规模预计到 2032 年将超过 1400 亿美元,较 2023 年的 191 亿美元大幅增长。Precedence Research 数据显示,边缘计算市场在 2032 年可能达到 3.61 万亿美元(CAGR 30.4%)。这些数据预示着边缘 AI 广阔的发展前景,也解释了为何大厂纷纷将目光投向这片新蓝海。

巨头布局,抢占先机

在边缘 AI 芯片赛道,大厂竞争激烈。芯片领域作为边缘 AI 发展的核心硬件支撑,近两年呈现出算力革新与架构创新并行的趋势。

苹果在 iPhone 系列中积极布局自研边缘 AI 芯片,以最新发布的 iPhone 16 系列为例,其搭载的 A18 芯片专为 AI 功能深度优化。A18 采用第二代 3 纳米工艺,集成 16 核神经网络引擎,每秒运算可达 35 万亿次 。这一强大算力使得面容 ID 识别瞬间完成,Animoji 生成也流畅无比,响应速度进入毫秒级时代。同时,得益于芯片的本地处理能力,数据无需上传至云端,从根本上规避了云端传输带来的隐私风险,为用户筑牢隐私防线。

英伟达作为图形处理及 AI 计算领域的佼佼者,在边缘 AI 芯片布局上同样成果斐然。其推出的 Jetson 系列边缘 AI 芯片,专为机器人、无人机、智能摄像头等边缘设备打造。以 Jetson Xavier NX 为例,这款芯片集成了 512 个 NVIDIA CUDA 核心和 64 个 Tensor Core,具备高达 21 TOPS(每秒运算万亿次)的算力,却仅需 15W 的功耗,能够为机器人在复杂多变的环境中提供强大的视觉识别与决策执行支持。在物流仓储场景中,搭载 Jetson Xavier NX 芯片的移动机器人可快速识别货物、货架位置,规划最优路径,高效完成货物搬运任务,大幅提升物流运作效率。

国内企业在边缘 AI 芯片领域也成绩亮眼。云天励飞 2022 年推出的 DeepEdge 10 系列专为边缘大模型设计;2024 年升级的 DeepEdge200 采用 D2D Chiplet 技术,搭配 IPU-X6000 加速卡,可适配云天天书、通义千问等近 10 个主流大模型,在智慧安防摄像头中实现异常行为实时识别,预警响应时间缩短至 0.5 秒内。

国产 AI 算力芯片公司主要产品 来源:民生证券

在 8 月 26 日晚间,云天励飞公布 2025 年半年度报告。财报显示,其 2025 年上半年实现营业收入 6.46 亿元,较上年同期增长 123.10%;归母净利润为 -2.06 亿元,同比亏损收窄 1.04 亿元;扣非净利润为 -2.35 亿元,同比亏损收窄 1.10 亿元。对于业绩变化,该公司表示,报告期内,营业收入较上年同期增加,主要是消费级及企业级场景业务的销售收入增加所致。亏损收窄主要系报告期内营业收入及毛利率同步增加所致。

数据来源:公司财报 半导体产业纵横制表

面对边缘设备内存、算力等资源受限的现实,谷歌、微软、Meta 等国际科技巨头等纷纷聚焦于轻量化大模型的研发与优化,以实现大模型在边缘设备上的高效运行。

谷歌在这一领域积极探索,通过对模型架构的精巧设计与参数的精细调整,将部分大模型进行了成功的轻量化改造。例如其推出的 Gemini Nano 模型,基于 Transformer 架构进行优化,在保持较高模型性能的同时,大幅减少了模型参数数量与计算复杂度,能够在智能安防摄像头等边缘设备上流畅运行,为实时视频图像分析提供有力支持。在城市安防监控网络中,部署了 Gemini Nano 模型的摄像头可实时识别行人、车辆,监测异常行为,及时发出警报,有效提升城市安全防控能力。

微软则另辟蹊径,推出的 phi-1.5 模型虽参数规模相对较小,但在模型训练数据选择上独具匠心。该模型采用了精心筛选的 27B token " 教科书级 " 数据进行训练,在数学推理能力方面表现卓越,超越了部分参数规模庞大的千亿级模型。在教育领域的智能辅导系统中,phi-1.5 模型可快速、准确地解答学生提出的数学问题,提供详细的解题步骤与思路,辅助教师教学,提升教学质量与效率。

爆发点,在哪里

智能家居设备是边缘 AI 最常见的应用场景之一。它让智能家居设备告别 " 单一指令执行 ",转向 " 行为预判式服务 "。智能温控器通过学习用户作息与睡眠周期,结合室外天气动态调温,既保障舒适又降低 15%-20% 能耗,远优于传统设备。以小度音箱为代表的终端,凭借边缘 AI 实现 0.3 秒内响应高频指令,还能联动跨品牌设备形成场景服务,如 " 回家模式 " 自动触发开灯、调温、放音乐,推动中国智能家居场景联动渗透率达 38%,超全球平均水平。

可穿戴设备是边缘 AI 的另一个重要领域。Meta 与雷朋合作的智能眼镜,在上海等城市实现毫秒级图像识别与本地翻译,无网状态下也能实时转换路牌文字、推荐周边店铺,累计出货量已经突破 200 万台。中国品牌更聚焦深度健康管理,华为 Watch GT 系列通过边缘 AI 融合心率、血氧、心电图等数据,筛查睡眠呼吸暂停综合征准确率达 85%,帮助超 10 万用户提前发现健康问题;OPPO 手环则依据用户运动数据实时调整强度,生成个性化计划,让健康管理形成 " 采集 - 分析 - 建议 " 闭环。

在工业领域,AI 与物联网、机器人的结合,正推动工厂从 " 单一设备自动化 " 升级为 " 全流程智能协同 ",通过边缘 AI 实时处理生产数据,实现 " 故障预判、流程优化、质量追溯 " 的全链条智能化。智能工厂中的机器人,已不再是 " 重复单一动作 " 的机械臂,而是具备 " 实时决策能力 " 的 " 智能生产单元 "。Arm 的计算平台则为工业物联网提供了 " 高效数据处理底座 "。工业场景中,一台智能设备每天会产生超 10GB 的传感器数据(如温度、振动、压力),若全部上传云端处理,不仅会占用大量带宽,还会导致数据延迟(可能达数分钟),而 Arm 平台的边缘计算能力可实现 " 本地数据过滤与分析 " —— 仅将 " 异常数据 "(如振动频率超出正常范围)上传云端,同时在本地生成 " 设备健康报告 ",提醒运维人员及时检修。

长远来看,边缘 AI 的深度价值,在于推动人工智能从 " 工具属性 " 向 " 场景属性 " 延伸。当智能不再依赖云端的远程支撑,而是嵌入到生活与生产的具体场景中 —— 从家庭温控器根据用户习惯动态调温,到工厂机器人自主优化作业路径,再到可穿戴设备为用户定制健康方案,人工智能才算真正融入产业肌理与生活日常。这种转变,既规避了技术泡沫化的风险,也让人工智能的价值在实际应用中落地生根。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 自动驾驶 首席执行官 谷歌
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论