钛媒体 昨天
AI进化受阻:搜索引擎仍未等到举杯时刻
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 逐浪

生活中,越来越难找到打开搜索引擎的理由了。

吃饭有点评软件,出行有导航地图,看新闻有资讯 APP,购物有网购平台,聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的 APP。

传统搜索引擎的优势荡然无存,处境尴尬。而 AI 浪潮的来临,让传统搜索有了新的进化方向。

OpenAI 正式上线 ChatGPT 的实时搜索功能;谷歌宣布其 " 双子座 "AI 模型将整合谷歌搜索功能;百度的 AI 智能回答,对文心大模型日均调用量超 6 亿次。

一场 AI 时代的搜索新 " 战事 " 正在上演,但 AI 搜索能否在用户生活中,提供足够 " 必要 " 的价值,仍是一个值得商榷的问题。

被抛弃的传统搜索引擎

一直以来,百度都长时间占据着中国互联网搜索领域的主导者位置。但随着用户搜索行为的多元化,传统搜索引擎的用户正在逐渐流失。

年轻人们在微博搜明星动态、热点新闻,在抖音和快手消耗琐碎时间,在小红书寻找经验攻略。

今年 6 月,钉钉总裁叶军曾在一场企业家论坛上谈到搜索变革,他表示,搜索场景已经被变革掉了,百度也得马上跟进,如果再不跟进,大家也不会用百度了。

搜索的前提,是平台有足够的内容,满足用户的信息需求。PC 时代,所有内容通过网页展示,传统搜索引擎依赖爬虫技术,抓取互联网上的网页,然后进行清洗和排序。当用户输入查询的词条后,搜索引擎会根据其算法对网页进行排序,并将结果展示给用户。爬虫抓取的信息数量越多,质量越好,传统搜索引擎的体验就越高。

而在移动互联网时代,互联网入口变为手机上一个个 APP,各 APP 厂商不愿意再将左右生死的流量权,交给搜索引擎,便高筑墙,深挖沟,将爬虫挡在门外,并加强运营机制,将优质内容、独家内容留在门内。于是,移动互联网时代,各 APP 内容孤岛化严重,信息从此不再 " 互联 "。

流量的走向,重塑着新的互联网格局。但传统搜索处境下滑的同时,各独立 APP 的搜索量与日俱增。

小红书有将近 70% 的月活用户有搜索行为,1/3 的月活用户打开小红书的第一件事就是直奔搜索;2023 年,抖音生活服务搜索 GMV 增长 254%,商品搜索 GMV 增长 143.8%;2024 年第二季度,使用快手搜索的月活跃用户近 5 亿,同时单日搜索次数同比增长超 20%。更不用说微博的热搜,凭借搜索,缔造了一个又一个顶流话题。

就目前而言,传统搜索引擎已经落后于时代,其本质原因,在于搜索引擎并不生产内容,只是内容的搬运工,而搜索内容的需求已经被内容方满足。

生成式 AI 的诞生,给了传统搜索引擎更沉重一击,人们不再需要在搜索结果中,寻找所需信息,AI 已可以通过自然对话方式,代替思考,提供答案。

人们直接跳过 " 搜索 ",直达信息的彼岸。

之于搜索引擎,这是鹤顶红,却也是回魂丹。受威胁最大的传统搜索引擎,成为生成式 AI 最忠诚的拥趸。

2023 年初,微软宣布与 OpenAI 合作,推出了由 AI 驱动的 Bing 搜索引擎和 Edge 浏览器。

同年 5 月,谷歌推出由生成式 AI 驱动的搜索引擎。谷歌称,这是谷歌搜索引擎多年来最大规模的一次革新。

2023 年 8 月,昆仑万维推出了国内第一款 AI 搜索引擎,2 个月后,百度也将旗下的简单搜索升级为 AI 互动式搜索引擎,在搜索页面内置文心一言大模型技术。

今年 6 月,360 公司正式发布了 "360AI 搜索 " 和 "360AI 浏览器 ";同一个月,知乎发布 AI 搜索产品 " 知乎直答 ";7 月,夸克升级了 " 超级搜索框 ",推出以 AI 搜索为中心的一站式 AI 服务。

行业出现了 " 无 AI,不搜索 " 的趋势,并且各大厂商为 AI 搜索赋予重任。

生成式 AI,正在生成传统搜索的未来。

AI 搜索难当大任

AI 搜索引擎与传统搜索引擎有着显著的区别。

传统搜索引擎像一个图书馆的目录卡,用户需要提供书的具体书名或作者,才能找到书的位置。AI 搜索引擎更像一个图书管理员,用户只需要告诉它大概的信息,它就能找到相关的书,并总结书中的主要内容。

而且,AI 搜索还不局限于文字,能理解和索引视频、图片、语音等内容。还能实现了 AI 写作、AI 文件总结等操作。

但 AI 搜索的发展似乎并不顺利。以上一切全新体验的前提,在于搜索的结果,务必精准。

谷歌 AI 搜索上线不久后就闹出了不少笑话。很多用户都反映,AI 搜索在 " 胡言乱语 "。

一位用户向谷歌 AI 搜索提问 " 我每天应该吃多少块石头 ",得到的回答是 " 根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头 "。

在今年的百度世界 2024 大会上,百度发布检索增强的文生图技术 iRAG,可结合百度搜索的图片资源,消除大模型,生成各种超真实的图片," 去除了机器味儿 "。

而在媒体复刻发布会所展示的 " 爱因斯坦与天坛合影 " 指令时,大模型仍然出现错误幻觉:原本三层护栏,变成了四层甚至五层。

就目前而言,AI 搜索生成答案的准确性和可靠性依旧难以保证、容易出现事实错误,且生成的内容缺乏深度、无法提供有效的溯源。

诺贝尔经济学奖得主保罗 · 克鲁格曼曾在社交媒体上批评了当前的人工智能,称它比没用还糟糕," 有很多关于谷歌和其他搜索引擎退化的消息。这是真的,让我的工作变得困难 "。

同时,AI 的滥用还在加剧互联网信息的混乱,产生很多无效信息、虚假信息,混淆了正常搜索的结果。

今年 1 月,江西南昌的一家 MCN 利用 AI 工具日产 7000 篇文章。文章内容真假混杂,甚至引发了网传西安有巨大爆炸声的谣言。

温州公安最近也抓捕了一位网络作者。该作者利用 AI 工具批量改写网络文章,发布到信息平台从而获得文章收益,最终造成了诸多不良的社会影响。

伴随着 AI 工具的普及,AI 制造的无用、虚假信息的数量也越来越多。

清华大学新闻学院的报告称,近一年来,经济与企业类 AI 谣言,增速高达 99.91%。谷歌研究人员也发现生成式 AI 造成的虚假信息正在互联网上泛滥成灾。

虽然,目前 AI 引发的内容风险还没有上升到 " 威胁生存 " 的地步,但按照 AI 的发展趋势来看,这种伪造或篡改的信息会越来越多。

最终导致互联网的信息更加混乱,使得真实与虚假之间的界限模糊。

甚至 AI 自己,也将在越发低质的语料库中停止进化与生长。

信息荒漠时代

随着 AI 生成的错误和无意义的信息会不断累积,互联网的错误、无用信息占比会逐步增加。

清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳说,AI 生成的内容急剧增加,大量自媒体文章的内容由 AI 自动生成,而 AI 幻觉产生的错误就夹杂在这些文章当中,这也会造成整个互联网的内容质量进一步下降,导致数据质量的整体下降。这种现象被称为 " 数据退化 "。

AI 的训练和学习需要大量的网络信息,但大量虚假和无意义的信息只会让 AI 陷入混乱,产生错误观念。

不止如此,AI 除了要面临劣质内容的侵害,还面临优质底层信息的短缺。

研究公司 Epoch AI 表示,到 2028 年,文字资料将会被消耗殆尽。而这些数据是人类在在过去几个世纪里,创作的大量文字、视频。

也有人试图用 AI 生成的信息训练 AI,但结果并不美好。国外的科学家发现,如果 AI 只学习其他 AI 生成的内容,那么经过几代训练后,AI 将输出无意义的垃圾信息。

他们把这种现象称为 " 模型崩溃 "。

当前正处于信息大爆炸时代,我们所有人都被大量的信息所包围,但是对于 AI 而言,这是一个数据匮乏的时代。

对 AI 而言,谁能帮助 AI 摆脱信息匮乏的窘相,谁就掌握了 AI 发展的未来。为此,OpenAI、Anthropic、百度等公司都在积极开发更优质的合成数据,以此克服挑战。但大多数学者都持悲观态度。

今年 11 月,有外媒报道,OpenAI 下一代旗舰模型 " 猎户座 "(Orion)的性能提升幅度,小于 GPT-4 相对 GPT-3 的提升。

其创始人奥特曼曾表示,可能不会把新模型命名为 GPT-5。

多位专家劝说 AI 公司停止训练大模型," 如果当前趋势持续,人工智能很快就会耗尽其可用的训练数据。面对这种情况,AI 公司可以选择停止追求规模更大、更复杂的模型。"

AI 是当前互联网进步的主要动力之一,尤其是对搜索引擎而言,谁能突破 AI 的限制,谁就掌握了搜索市场的未来。

只是,这杯庆功酒遥遥无期。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

搜索引擎 ai 百度 小红书 互联网
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论