量子位 03-08
懂AI PC的人要先拥抱新世界了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2024 年第一个四分之一还没过完,PC 市场的最热关键词,已是非「AI」莫属。

最新消息,继联想、荣耀之后,微软的首款AI PC马上也要来了。

据 Windows Central 爆料,微软将于 3 月 21 日发布新款 Surface Pro 和 Surface Laptop。

两款新品围绕人工智能打造:

硬件方面,Intel 版本搭载号称 "AI CPU" 的全新 Intel Core Ultra,arm 版本则用上了能把130 亿参数大模型塞进 PC的高通骁龙 X Elite。

软件方面,两款新品均将首批支持 Windows 11 的 " 下一代 "AI 体验,包括一个内部名为 "AI Explorer" 的全新 AI 功能。

消息人士称,AI Explorer 将会 " 使 AI PC 与非 AI PC 完全区分开来 ",依靠自然语言交互,用户就能在 PC 上完成一切。

(贾维斯内味儿,这不就来了吗 doge)

这还不算完,各种老牌 PC 玩家也都坐不住了,纷纷放出自家首款 AI PC 的消息。

由大模型技术风暴掀起的「模力时代」中,我们日常使用的生产工具正在加速变革

这样的趋势,现在越发明朗。而终端产品的变革,也意味着,对于人们的日常工作生活而言,新一代的办公、学习姿势已经在酝酿之中。

ChatGPT4 生成

那么,问题来了——

对于普通打工人而言,产品概念花里胡哨,但究竟怎样的 PC,才算是真正的 AI PC?

PC 可以怎样 AI?

终端侧 AI 趋势开始后,终端、芯片、应用厂商正在用一个个面向生成式 AI 的芯片逐步补全关于 AI PC 的定义。

最先勾勒出想象的是微软。

去年 9 月,Colpilot 正式进入 Windows 11,成为电脑系统的 AI 助手。

这彻底掀开 PC 上自然语言交互的序幕,更改设置、整理桌面、打开软件都能通过聊天的方式实现。

联想紧随其后,推出首款 AI PC,展示了大模型运行在本地后,给用户带来更加专属化的体验。

基于用户个性化信息创建本地知识库,量身定制完成一系列新任务。

比如基于电脑上的家庭照片和视频,创作一段 " 智能剪辑 "。

再或者是成为更本地化的工作助手,帮助写文档、总结知识点、提升生产力。

与此同时,最关键的底层芯片也重大更新。

高通发布骁龙 X Elite,就从底层角度给出了关于 AI PC 的一系列思考。

这块 4nm 制程的 CPU支持 130 亿参数大模型的本地运行,70 亿参数模型可每秒生成 30 个 token。

AI 引擎算力可达 75TOPS,AI 处理速度可达竞品的 4.5 倍。

CPU、GPU 性能均是竞品的 2 倍,相同峰值性能功耗比竞品低 68%。

除此之外,刚落幕不久的 MWC 2024 上,高通还展示了多模态大模型在 PC 本地运行的示例。

它能理解音频并进行推理,可实现语音输入的多轮对话。

这意味着,AI PC 趋势和多模态趋势正在交汇融合,传统 PC 的交互方式将发生更加彻底的变革。

透过厂商们的实际动作,一些关于 AI PC 的初步共识已逐渐清晰。

即 AI PC 应该成为一个用户专属的个人助理,它具备强大的 AI 能力和底层计算能力,将人类从日常生活中常规的、重复性的、看似琐碎的工作中解放出来,转而从事更加具有创造性、求变的工作。

但问题是,现在的传统 PC 如何才能走到这一步?哪些地方已经悄然发生改变?

技术趋势给出了一定答案。

AI 如何重塑 PC?

面向生成式 AI,PC 要经历的是一场全新计算架构的变革。从底层硬件到上层应用,都正在发生变化。

因为生成式 AI 浮现出的典型场景,给计算连接等都提出新要求。

高通最新公布的《通过 NPU 和异构计算开启终端侧生成式 AI》白皮书中总结,生成式 AI 用例可分为三类:

按需型:由用户出发,需要立即响应。比如在 PC 上生成会议摘要、开车时用语音查询最近的加油站。

持续型:运行时间较长。比如用手机进行实时对话翻译,PC 上玩游戏时逐帧运行超级分辨率。

泛在型:在后天持续运行。比如始终开启的预测性 AI 助手。

这些情况都面临两大关键挑战。

第一,考虑到终端的功耗和散热问题,通用 CPU 和 GPU 难以满足这些 AI 任务的计算需求。

第二,生成式 AI 应用还在不断丰富,不能在功能完全固定的硬件上进行部署。

硬件方面,NPU异构计算成为应对挑战的关键。

在终端侧 AI 趋势兴起后,原本更常出现在手机芯片上的 NPU,也开始在电脑芯片上发挥更加重要的作用。

NPU(Neural Processing Unit)专门为加速神经网络和 AI 任务而生,可以快速处理 AI 推理任务。它不易于编程,但能实现更高的峰值性能、能效和面积效率,从而运行机器学习所需的标量、向量和张量数学运算。

随着 AI 趋势演变,NPU 的设计也发生了一系列变化。比如 2015 年时,NPU 主要面向音频和语音 AI 设计,用于简单 CNN 并主要需要标量和向量数学运算。

后面随着 AI 在拍照和视频中的使用增多,以及 Transformer、RNN、LSTM 和高维度 CNN 等模型相继出现,NPU 又增加了张量加速器和卷积加速,可以降低内存带宽占用和能耗。

发展到大模型时期,低时延、续航、内存、等因素共同要求下,NPU 往往比 GPU 表现出更好的能效和性能,也使得NPU 成为生成式 AI 终端上不可或缺的部分

举例来看,骁龙 X Elite 上集成的 Hexagon NPU 算力达到 45TOPS。

在不损失太多精度的情况下,Fast Stable Diffusion 能够在0.6 秒内生成一张 512 × 512 分辨率的图像。

但随着生成式 AI 终端逐渐发展,端侧运行的模型可能规模还将继续扩大,多模态趋势已经显现,还有可能会搭载多个大模型。

仅靠 NPU 来支撑生成式 AI 任务,可能还不是最佳方案。

目前厂商们已经开始通过异构计算,让不同处理器分别处理擅长的任务,也就是让全部处理器都来支持生成式 AI 任务。这一直是高通坚持且擅长的赛道。

GPU 不仅用于处理图像任务,也能用于以高精度格式进行 AI 并行处理,支持 FP32、FP16、INT8 运算。

CPU 则能用于计算量低、要求低时延的 AI 任务上,如高通 Oryon CPU 性能达竞品的 2 倍,功耗还降低了三分之二。

处理器之间的相互配合,可以进一步释放 AI 引擎性能,超越单 NPU 效果。

与此同时,软件层面也受到 AI 影响发生改变

一方面,生成式 AI 终端需要软硬结合才能更充分释放性能;另一方面,开发者也需要适宜当下的工具,能够更快速将大模型加入到应用中。

在 MWC 2024 上,高通宣布推出的AI Hub正是这样一个平台。

它是一个全面的模型优化库,为开发者提供超过 75 个主流模型,如 Stable Diffusion、ControlNet、Baichuan-7B 等。这些模型全部经过优化,可以充分利用高通 AI 引擎内所有核心的硬件加速能力,实现 4 倍推理速度提升。开发者能快速将大模型无缝集成到应用程序中,缩短产品面市时间。

同时这些优化后的模型也同步上线到 GitHub、Hugging Face。开发者可在搭载高通和骁龙平台的云托管终端上自行运行模型。

更早推出的高通 AI Stack可全栈支持主流 AI 框架(如 TensorFlow、PyTorch、ONNX 和 Keras)和 runtime。集成高通神经网络 SDK,面向 Android、Linux 和 Windows 不同版本。

此外还提供一系列量化、压缩开发工具,能够在尽量不降低模型精确度同时压缩模型。一些生成式 AI 模型由此可以量化至 INT4。

总之,从底层硬件到上层软件,都在以生成式 AI 为中心进行快速变革。

巨头们脚步一致,纷纷加速 All in AI,也让生成式 AI 带来的变革更加迷人。

AI 变革究竟会如何影响每一个人的生活?

AI PC 展现出的演进过程,已经给大家做了一些小剧透。

AI PC 通往何处?

细数起来,AI PC 从概念兴起到初步产品落地,刚刚过去半年的时间。

高通产品管理高级副总裁兼 AI 负责人 Ziad Asghar 将其类比为 " 人们刚刚能够实现手机上网 " 的阶段:数十亿人都能够通过手机连接到网络,奠定了此后移动互联网应用大爆发的格局。

我想如果我们能够在终端侧实现 AI 的发展,就可以把生成式 AI 的能力和优势充分发挥出来,打破所有的界限,利用生成式 AI 的能力让我们在生活、工作、娱乐、医疗等各个方面都获得更好的体验。

换言之,AI 重构 PC,现在正是打地基的阶段。

从上述各大厂商的动作之中,可以梳理出几个关键的环节:

云端大模型能力向终端侧的迁移

为生成式 AI 打造的芯片 +AI 开发平台

基于 AI+5G 技术的设备互联

前两者不再做过多赘述,设备互联,则关系到生成式 AI 的发展从第一阶段走向第二阶段的实质:

数据在哪里,AI 推理就在哪里进行

短期来看,终端生成式 AI 基础能力的构建,能在手机、PC 这样的生产力终端上率先带来应用的爆发,提高生产效率、带来新的创新机会——

对于普通用户,人机交互方式彻底变革,自然语言操作一切,带来的是更高的终端使用效率。

对于开发者而言,新一轮的 AI 原生应用爆发机遇,已经是现在进行时。AI 搜索应用 Perplexity,刚刚被曝估值将破 10 亿美元,跻身独角兽行列。

而对于终端厂商而言,从底层芯片到操作系统的变革,也将带来重塑市场格局的机会。

从更长期来看,更重大的影响则是,AI PC、AI 手机的背后,真正的私人 AI 助理将会出现:用户能够在本地打造专属的 Agent,而通过终端设备互联,AI Agent 将可以渗透到生活的方方面面。

工业革命的核心,是生产力的突破和生产方式的变革。AI 掀起的技术风暴,概莫能外。

而就像从纸质办公到网络办公,处在当下的我们还无法窥见未来的全貌,但可以预见的是,以人为中心,AI 将自然流转于手机、PC、智能车、AR/VR,乃至全新的 AI 硬件之上,构建起真正的万物互联。

身处这样的时代,对于直面风暴的技术厂商们而言,如何跟上趋势,已有高通这样的先行者给出参考。

而对于我们每一个普通而言,更重要的是,认真思考如何拥抱新变革的时间点,已经到来。

毕竟先拥抱新趋势的人,先享受世界。

—    —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

ai 芯片 windows 微软 联想
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论