豆包 AI 手机承载了字节的硬件梦,从目前的原型来看,是很有机会爆发的。从演示来看,字节通过底层权限和模拟操作的路径,可能会争夺几乎所有互联网应用的入口,引起互联网行业的剧烈震荡;在简单的演示中,美团和阿里已经被针锋相对,直接降级到被调用的地位。两个刚打完仗的巨头转头发现家要被偷了。
即使不做得太绝,AI 手机也会团灭一批智能硬件。在深圳看硬件的 VC 们要冷静思考下了。
让我惊讶的其实是,这样的 AI 手机直到现在才出现。大厂主导的 AI 手机出似乎是迟早的事情。智谱其实做过类似的尝试,但身体量确实差一些,没跑通和手机厂的合作,产品也没成熟。荣耀算是跑得比较快的,在不断开发小模型、小场景 AI,但可能依然跑不过互联网大厂,尤其是字节这样的卷王。
让所有应用厂商感到恐惧的应该是,豆包似乎执意采取模拟操作的方式,将自己的权限架在所有应用之上。
从它今天放出的演示可以看到,截图一个产品后,它可以操作所有的购物应用进行比价。尽管有底层授权和模拟操作 2 种模式,豆包似乎准备采取第二种方式,直接绕过所有的应用,充分利用自己的操作系统底层优势,直接模拟操作、打开和调用。
一旦使用熟练、用户体验良好,大部分的应用都会失去入口的权利,大量的流量广告会失去价值。
这会让整个互联网炸毛。想想阿里、拼多多、携程会如何疯狂,他们构建了这么久的软件应用矩阵、内容,尝试让用户待得足够久。不要说有的用户天生就喜欢逛。很多时候逛的前提是打开进入 - 被吸引 - 不知不觉逛,字节想做的是直接抢了第一步,让你和我交互,再叠加我让你逛的引导。
别忘了,逛这个行为,字节太在行,头条和抖音简直就是鼻祖。
演示中,已经看到美团和淘宝被调用了。两个刚打完架的巨头发现打着打着老家快被绕后了。
如果往下推,这会是腥风血雨,我们很快会见到市场剧烈的反应。但我估计这其中牵涉到太大的利益,会一波三折。
字节带着手机厂 vs. 所有应用。互联网最大的价值在应用,手机厂被压制久矣,也会希望拿回主动。但应用的反弹也不可忽视。
确实,应用可以选择,我有不被操作系统模拟操作的权利。但是,如果一些应用投降了呢,如果用户习惯了用 AI 调用,懒得再去迷宫一样的界面、绕开时不时误点就要进广告的打开页呢?你是接受调用还是拒绝?拒绝的话打开率下降怎么办?
就连 B 站这样的视频平台是不是也有危险?如果豆包能根据喜好整合视频流呢?就像我们投过的单一 APP 和设备,能整合所有音乐平台创造自己的歌单,很受用户欢迎。
有意思的是,微信似乎还没太被针对。也许社交粘性太强、太个人化、太敏感。很多 AI 功能微信自己也可以在自己体系内完成。但我还是会饶有兴致地看,如果字节要把手伸向微信,会如何反应。
也许最后上述的血战并不会出现,也许字节只是要用极限施压来搅局,切下巨大市场的一小块,也许最后 AI 应用的交互方式还不足以改变用户手点的习惯。
但手机市场的鲶鱼出现了。一个沉闷很久却日夜不离身、存量巨大的超级设备。
端侧最大的两个硬件——手机和 PC,还远远没有 AI 化。
很多人觉得 token 用量会见顶,但相反,这是我一直持有的一个观点:在操作系统、底层硬件彻底 AI 化之前,token 的使用量远远没达到峰值。
手机里最常用的 2 个系统级应用,在 AI 时代看起来都傻得可怜。这 2 个应用是拍摄和录音。
相册语义搜索和整理确实在普及,但是仍不足够智能,一定程度上受困于端侧算力。这个体验差异体现在,我将 100 张图片上传到在线的大语言模型后让其整理、编辑,甚至重新生成,和在本地处理的体验是天差地别的。但这上传的额外动作会打退大部分用户。以至于一些过渡态产品承接了这个功能,比如云盘、NAS。但你去使用下阿里的云盘,会发现找文件、索引、搜索视频和图片的功能近乎于无,完全就是一个木讷的存储。
将一个存量的、最大的个人数据库智能化起来,会比新建一个存储空间来得快捷、方便、直观得多。
豆包和操作系统打通后,会轻易地将整个数据库智能化起来。
对于整个算力产业来说,这也会大幅增加数据的传输量和 token 的使用量。
至于智能硬件本身,今年以来全国的 VC 都在往深圳跑。但可以先缓缓观察一下,因为 10 亿级出货量的手机一旦出现重大变化,消灭一两个硬件新兴赛道只是顺手的事情。
苹果本身确实有抢占 AI 化入口得天独厚的优势,软硬件操作系统全占,但产品思路上确实保守。字节在耳机、VR 显示不太成功的尝试后,依然没有放弃抢夺硬件入口,这次选择了和品牌手机合作的方式,效法华为和车企的模式,显然更加明智。
我们可以用录音这个场景推演一下这会给智能硬件产业带来怎样的冲击。
所有外置的录音设备,包括很火的录音卡贴、应用的内置录音,其实都比不上手机操作系统的录音。手机统一归档和方便这两点就击败了所有竞对。
在各种会议场合,拿出手机放在桌上,是再平常、自然不过的动作,比拿出任何额外设备都要让人放心,甚至根本不会察觉。
我不知道是不是因为大家默认手机放裤子口袋会有辐射影响,还是放桌面能随时看到急事呼叫,但结果就是大家根本不在意。
有时候,征询能否录音反而会让氛围变得奇怪,如果目的就是自己听和复盘,手机仍然是最无感的录音方式。
和所有会议软件的自带录音相比也是。如果既用了飞书又用了腾讯会议,还要分别去不同的地方翻找,有时候还要申请权限,更不用说通话录音。
但就因为此前操作系统层面的录音不尽如人意,包括在大模型会议总结上落后于专业会议软件,使得出现了专门的会议录音产品。Plaud 据称有 2.5 亿美金的年化收入,最近也在尝试进入中国市场,很大程度是因为苹果通话没法录音,以及它的会议总结模型做得好。但这在安卓占比更高的中国不太成立,甚至苹果本身的保守在各种录音产品雨后春笋出现后也有点掩耳盗铃。
虽然这涉及一个底层问题:用户有没有重新听一遍、保留自己交谈经历的权利?但实际上,一旦大家让录音这个事本身门槛剧降后,是一个必须有的事情,更何况用户应该有记录自己日常生活的权利。
市场上有一大票的智能硬件产品其实生活在巨头的阴影中,只是还不自知。
举个例子,有人在做 AI 相机,现场出图、修改、生成。整合了视频模型的 AI 手机很可能会顺便一脚踢死做得不够好的 AI 相机。
时代的列车正在尽兴碾压。


登录后才可以发布评论哦
打开小程序可以发布评论哦