卫夕指北 06-10
百度网盘文库能成为AI时代的“瑞士军刀”吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

一、" 相机 +AI" 会碰出什么火花?

在聊如何改造今天的手机上的相机之前,我们先来回顾一小段相机发展的历史——

1913 年 6 月,德国工程师奥斯卡 · 巴纳克设计了一款轻型相机,这款相机创造性地使用 35 毫米电影胶片作为底片。

而在此之前相机都使用巨大的 8*13 厘米玻璃底片,使用这种底片的相机体积巨大,需要装在笨重的木盒里使用大型三脚架才能固定。

所以,在巴纳克的发明之前,照相是一种室内行为,人们在照相馆里拍摄表情僵硬的肖像,而巴纳克的发明让相机第一次变得便捷。

人类第一次可以随意在户外拍摄鲜活、真实的画面,这款相机被命名为 "Leica"。

是滴,1913 年,徕卡改变了人们使用相机的方式,从实用主义的产品哲学出发,真正提高了相机的使用频次。

令人吃惊的是,他的方法并不是提升相机的拍照质量,而是彻底革新了相机的使用场景。

今天,AI 给了相机一个 " 徕卡 " 级别的机会,让充当 " 眼睛 " 功能的相机能真正接入 " 大脑 "。

这就是这次百度 AI Day 上文库和网盘发布 "AI 相机 " 想要做的事情——打造存储、搜索、修图、扫描、翻译、创作一体的全模态超级入口,全面覆盖存、管、用、创、享各环节能力。

二、到底什么是真正的 "AI 相机 "?

" 覆盖存、管、用、创、享的全模态入口 " 到底是什么意思?

或者说,和手机自带的相机相比,百度的这个 "AI 相机 " 有什么特别之处?

大部分人使用相机的一个常规操作是,先用手机原生相机拍照,然后到修图应用修图,到扫描应用识别,到翻译应用翻译,然后同步到云盘存储管理。

这个体验是割裂的,是分散的,是有成本的,是存在摩擦的。

而 "AI 相机 " 就是要解决这个问题——用一站式、用 All in One 的方式。

直观地说,就是拍只是起点,围绕拍之后的一系列 AI 动作才是核心——修图美颜、拍照识别、解题、文字提取、翻译、扫描、合同检查等一系列 AI 功能,一站式解决用户 99% 的对照片的存储、拍摄、处理、管理等需求。

无论是生活场景的景点讲解、植物识别、商品识别,还是工作场景的文件扫描、票据存档,还是学习场景的拍照解题、错题讲解,AI 相机都可以一条龙解决。

更重要的是,它还能「即拍即存」,所有拍摄云端直存,释放出大量手机内存,让用户彻底告别内存焦虑,真正帮助用户实现 " 拍、存、管 " 一体。

而它的长期管理功能,比如分享、智能分类、智能搜图等功能则进一步增加了它的实用性——按地点、人物、事物、照片类型、资料类型等多维度智能分类。

甚至不少明星工作室、明星后援会都用百度网盘的相关功能来拉动与粉丝之间的互动。

AI 相机 All in One 的设计

三、为什么说百度文库网盘在打造 AI 时代的瑞士军刀?

事实上,AI 相机是文库网盘敢说自己全模态输入、处理输出在输入层面的一个缩影。

而在我看来,百度文库网盘现在做的事情就是在打造 AI 时代的瑞士军刀。

瑞士军刀有什么本质特征?

因为它体现了技术设计的根本原则:通过合理整合提升实用性。

在工具稀缺的时代,我们追求每个工具的极致性能,但在工具过剩的时代,我们追求工具的整合性、便携性和实用性——用户不想在很多个不同的 AI 工具之间跳来跳去。

百度文库和网盘希望做到:在你需要 AI 帮助的时候,它总是在那里,而且你不需要思考该用哪个工具。

它们的目标,是让 AI 不再是零散的工具,而是能一站式解决问题的 " 超级生产力 "。

就像一百多年前,一名士兵需要的不是一把最锋利的刀、一个最坚固的螺丝刀和一把最精准的剪刀,而是一把能随时解决所有问题的瑞士军刀。

具体而言,百度通过 " 打点、连线、结网 " 的方式做到了全模态输入、处理到输出的完整交付。

如何理解?

我们逐一来看——

先看全模态输入—— " 啥都能接住 "。

输入的背后是需求,而全模态输入可以最大范围锁定用户需求——全天候、全方位接受并响应用户需求、启动任务,支持各场景、各地区、各客户端、各设备的键盘、AI 麦克风、AI 相机、AI 视频等全模态输入方式。

举个例子,很多 AI 产品是不支持用户输入网址的,也就是用户丢一个 http 开头的链接进去,它只知道这是一串字符串,根本没办法解析背后的内容,而这会严重限制用户的输入带宽。

毕竟一个用户的任何需求都不是凭空产生的,而是有起点的,这个起点大概率是基于某个已有的材料:一段视频、一篇文章、一期播客,然后衍生 AI 需求,而全模态的需求则可以最大程度接住这种需求。

而要接住每一种模态的的输入,其实依赖非常系统的基建,接住这些需求一方面既消耗大量的 token,另一方面也依赖非常产品在细节层面的优化。

再看全模态处理—— " 一个完整健全的神经系统 "。

这里的全模态处理,其实核心是基于沧舟 OS 实现的,沧舟 OS 核心就是三个模块——首先智能高效的调度系统,其次是海量公私域内容数据,最后是全面的 AI 能力。

一个直观的比喻就是——沧舟 OS 是一个完整的 " 神经系统 ",它不直接创造,但它感知、协调和调度。

它连接着各种功能模块——那数百个 AI Agent,有的是 " 眼睛 "(AI 相机,负责视觉输入),有的是 " 大脑 "(大模型,负责思考规划),有的是 " 手 "(PPT Agent、文档 Agent),还有的是庞大的 " 记忆体 "(文库和网盘的数据库),最后形成合力,应对不同的全模态需求。

最后看全模态交付—— " 拒绝半成品:打通交付最后一公里 "。

" 用户要的不是一把电钻,而是墙上的那个洞。"

没错,对于 AI 产品也一样,用户要的不是一个点的交付,而是一个完全体的交付,要的不是食材,而是一盘菜。

以新功能 "GenFlow 超能搭子 " 为例,你就只需要输入如下需求——

" 最近逛商场看到好多卖动漫二次元周边的店,现在这个很火热吗 ? 我也是学设计的,能靠这个创业吗 ? 帮我写个市场调研报告 "

几分钟之后,一份 27 页、2.3 万字、8 个图表的详细调研报告就完成了,而且这个报告还支持代码模式进行查看,这就是全模态交付的重要性。

是滴,大部分用户通常需要图文并貌的文章、有专业图表的 PPT、带声音的视频,以及这些内容的组合。

然而对于大部分 AI 产品,用户拿到的都是原材料或者是半成品,需要做很多后续工作。

就好像给一堆乐高积木块,然后说:" 看,你可以用它搭出任何东西!"

但用户真正想说的是:" 我不想搭,我想要那座已经搭好的城堡。"

没错,通过打点、连线、结网,百度文库网盘将工具基建有机地整合成一个整体,而用户只需要便捷地享用一站式服务。

四、被低估的百度文库网盘

很多人 AI 前沿的从业者会有一个有意无意的倾向——追新,即认为新诞生的 AI 产品天然就更加 AI Native,而从传统工具转型 AI 的产品则没有那么性感。

我是不支持这个论调的,在我看来,用户用脚投的票才是判断一个 AI 产品的核心。

从这个意义上,我想分享在我看来百度文库和百度网盘做的很好的两个点——

1. 善用信任的惯性

的确,在前 AI 时代,大量用户已经把他们非常珍贵的数字资产——家庭照片、工作文档、学习资料——交给了百度文库和百度网盘。

比如百度文库 14 亿专业文档、1000 亿 GB 存储量——这些数字背后是真实的用户需求和使用场景。

这种基于信任的长期关系,正是百度网盘、百度文库直接用 AI 重构现有产品的出发点——不另起炉灶,而是延续信任的惯性。

百度的聪明之处在于:他们没有要求用户学习全新的工具,而是在用户已经熟悉的文库和网盘中无缝集成 AI 功能,解决实际问题,这大大降低了用户的心理门槛和冷启动难度。

2. 独有的数据是重要的护城河

没错,OpenAI 的山姆奥特曼在最近也多次强调 "Memory" 对于 ChatGPT 的重要性。

在他看来,这是将用户长期留在 ChatGPT 这个产品里的关键点,谷歌也在 Gemini 产品中强调了搜索记录等数据的重要性。

而文库的公域知识库、网盘的私域数据库和用户记忆库则构成了更立体的数据,它更深层次的意义在于,可以为 AI 提供了个性化的上下文,而这是其独有的、不可复制的资产。

随着百度文库网盘在 AI 内容创作、内容消费、个人知识库等领域继续深耕,探索大模型行业从深度思考走向 " 深度交付 ",其在与用户海量交互中升级的立体数据会成为产品深厚的护城河。

的确,用户用脚投票的数据是最诚实的,目前百度文库 AI 月活用户达 9700 万。

而百度网盘的 AI 月活用户超 8000 万,在 6 月 3 日的 AI 产品榜中,百度网盘 APP MAU 超 1.5 亿,位列应用榜国内总榜第一、全球总榜第二,仅次于 ChatGPT。

结语

百度文库网盘这个 " 全模态输入、处理、输出系统 " 其实是一个承诺,这个承诺就是——

" 告诉我你的想法,剩下的交给我。我会用我所知道的一切(文库),和你拥有的一切(网盘),把它搞定。"

对于泛知识工作者而言,这是一个非常有吸引力的承诺,它意味着更少的摩擦,更多充满确定性的创造,有望通过完整的交付重塑 " 超级生产力 "。

—— End ——

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 百度 徕卡 翻译
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论