钛媒体 20小时前
AI进化受阻:搜索引擎仍未等到举杯时刻
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 逐浪

生活中,越来越难找到打开搜索引擎的理由了。

吃饭有点评软件,出行有导航地图,看新闻有资讯 APP,购物有网购平台,聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的 APP。

传统搜索引擎的优势荡然无存,处境尴尬。而 AI 浪潮的来临,让传统搜索有了新的进化方向。

OpenAI 正式上线 ChatGPT 的实时搜索功能;谷歌宣布其 " 双子座 "AI 模型将整合谷歌搜索功能;百度的 AI 智能回答,对文心大模型日均调用量超 6 亿次。

一场 AI 时代的搜索新 " 战事 " 正在上演,但 AI 搜索能否在用户生活中,提供足够 " 必要 " 的价值,仍是一个值得商榷的问题。

被抛弃的传统搜索引擎

一直以来,百度都长时间占据着中国互联网搜索领域的主导者位置。但随着用户搜索行为的多元化,传统搜索引擎的用户正在逐渐流失。

年轻人们在微博搜明星动态、热点新闻,在抖音和快手消耗琐碎时间,在小红书寻找经验攻略。

今年 6 月,钉钉总裁叶军曾在一场企业家论坛上谈到搜索变革,他表示,搜索场景已经被变革掉了,百度也得马上跟进,如果再不跟进,大家也不会用百度了。

搜索的前提,是平台有足够的内容,满足用户的信息需求。PC 时代,所有内容通过网页展示,传统搜索引擎依赖爬虫技术,抓取互联网上的网页,然后进行清洗和排序。当用户输入查询的词条后,搜索引擎会根据其算法对网页进行排序,并将结果展示给用户。爬虫抓取的信息数量越多,质量越好,传统搜索引擎的体验就越高。

而在移动互联网时代,互联网入口变为手机上一个个 APP,各 APP 厂商不愿意再将左右生死的流量权,交给搜索引擎,便高筑墙,深挖沟,将爬虫挡在门外,并加强运营机制,将优质内容、独家内容留在门内。于是,移动互联网时代,各 APP 内容孤岛化严重,信息从此不再 " 互联 "。

流量的走向,重塑着新的互联网格局。但传统搜索处境下滑的同时,各独立 APP 的搜索量与日俱增。

小红书有将近 70% 的月活用户有搜索行为,1/3 的月活用户打开小红书的第一件事就是直奔搜索;2023 年,抖音生活服务搜索 GMV 增长 254%,商品搜索 GMV 增长 143.8%;2024 年第二季度,使用快手搜索的月活跃用户近 5 亿,同时单日搜索次数同比增长超 20%。更不用说微博的热搜,凭借搜索,缔造了一个又一个顶流话题。

就目前而言,传统搜索引擎已经落后于时代,其本质原因,在于搜索引擎并不生产内容,只是内容的搬运工,而搜索内容的需求已经被内容方满足。

生成式 AI 的诞生,给了传统搜索引擎更沉重一击,人们不再需要在搜索结果中,寻找所需信息,AI 已可以通过自然对话方式,代替思考,提供答案。

人们直接跳过 " 搜索 ",直达信息的彼岸。

之于搜索引擎,这是鹤顶红,却也是回魂丹。受威胁最大的传统搜索引擎,成为生成式 AI 最忠诚的拥趸。

2023 年初,微软宣布与 OpenAI 合作,推出了由 AI 驱动的 Bing 搜索引擎和 Edge 浏览器。

同年 5 月,谷歌推出由生成式 AI 驱动的搜索引擎。谷歌称,这是谷歌搜索引擎多年来最大规模的一次革新。

2023 年 8 月,昆仑万维推出了国内第一款 AI 搜索引擎,2 个月后,百度也将旗下的简单搜索升级为 AI 互动式搜索引擎,在搜索页面内置文心一言大模型技术。

今年 6 月,360 公司正式发布了 "360AI 搜索 " 和 "360AI 浏览器 ";同一个月,知乎发布 AI 搜索产品 " 知乎直答 ";7 月,夸克升级了 " 超级搜索框 ",推出以 AI 搜索为中心的一站式 AI 服务。

行业出现了 " 无 AI,不搜索 " 的趋势,并且各大厂商为 AI 搜索赋予重任。

生成式 AI,正在生成传统搜索的未来。

AI 搜索难当大任

AI 搜索引擎与传统搜索引擎有着显著的区别。

传统搜索引擎像一个图书馆的目录卡,用户需要提供书的具体书名或作者,才能找到书的位置。AI 搜索引擎更像一个图书管理员,用户只需要告诉它大概的信息,它就能找到相关的书,并总结书中的主要内容。

而且,AI 搜索还不局限于文字,能理解和索引视频、图片、语音等内容。还能实现了 AI 写作、AI 文件总结等操作。

但 AI 搜索的发展似乎并不顺利。以上一切全新体验的前提,在于搜索的结果,务必精准。

谷歌 AI 搜索上线不久后就闹出了不少笑话。很多用户都反映,AI 搜索在 " 胡言乱语 "。

一位用户向谷歌 AI 搜索提问 " 我每天应该吃多少块石头 ",得到的回答是 " 根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头 "。

在今年的百度世界 2024 大会上,百度发布检索增强的文生图技术 iRAG,可结合百度搜索的图片资源,消除大模型,生成各种超真实的图片," 去除了机器味儿 "。

而在媒体复刻发布会所展示的 " 爱因斯坦与天坛合影 " 指令时,大模型仍然出现错误幻觉:原本三层护栏,变成了四层甚至五层。

就目前而言,AI 搜索生成答案的准确性和可靠性依旧难以保证、容易出现事实错误,且生成的内容缺乏深度、无法提供有效的溯源。

诺贝尔经济学奖得主保罗 · 克鲁格曼曾在社交媒体上批评了当前的人工智能,称它比没用还糟糕," 有很多关于谷歌和其他搜索引擎退化的消息。这是真的,让我的工作变得困难 "。

同时,AI 的滥用还在加剧互联网信息的混乱,产生很多无效信息、虚假信息,混淆了正常搜索的结果。

今年 1 月,江西南昌的一家 MCN 利用 AI 工具日产 7000 篇文章。文章内容真假混杂,甚至引发了网传西安有巨大爆炸声的谣言。

温州公安最近也抓捕了一位网络作者。该作者利用 AI 工具批量改写网络文章,发布到信息平台从而获得文章收益,最终造成了诸多不良的社会影响。

伴随着 AI 工具的普及,AI 制造的无用、虚假信息的数量也越来越多。

清华大学新闻学院的报告称,近一年来,经济与企业类 AI 谣言,增速高达 99.91%。谷歌研究人员也发现生成式 AI 造成的虚假信息正在互联网上泛滥成灾。

虽然,目前 AI 引发的内容风险还没有上升到 " 威胁生存 " 的地步,但按照 AI 的发展趋势来看,这种伪造或篡改的信息会越来越多。

最终导致互联网的信息更加混乱,使得真实与虚假之间的界限模糊。

甚至 AI 自己,也将在越发低质的语料库中停止进化与生长。

信息荒漠时代

随着 AI 生成的错误和无意义的信息会不断累积,互联网的错误、无用信息占比会逐步增加。

清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳说,AI 生成的内容急剧增加,大量自媒体文章的内容由 AI 自动生成,而 AI 幻觉产生的错误就夹杂在这些文章当中,这也会造成整个互联网的内容质量进一步下降,导致数据质量的整体下降。这种现象被称为 " 数据退化 "。

AI 的训练和学习需要大量的网络信息,但大量虚假和无意义的信息只会让 AI 陷入混乱,产生错误观念。

不止如此,AI 除了要面临劣质内容的侵害,还面临优质底层信息的短缺。

研究公司 Epoch AI 表示,到 2028 年,文字资料将会被消耗殆尽。而这些数据是人类在在过去几个世纪里,创作的大量文字、视频。

也有人试图用 AI 生成的信息训练 AI,但结果并不美好。国外的科学家发现,如果 AI 只学习其他 AI 生成的内容,那么经过几代训练后,AI 将输出无意义的垃圾信息。

他们把这种现象称为 " 模型崩溃 "。

当前正处于信息大爆炸时代,我们所有人都被大量的信息所包围,但是对于 AI 而言,这是一个数据匮乏的时代。

对 AI 而言,谁能帮助 AI 摆脱信息匮乏的窘相,谁就掌握了 AI 发展的未来。为此,OpenAI、Anthropic、百度等公司都在积极开发更优质的合成数据,以此克服挑战。但大多数学者都持悲观态度。

今年 11 月,有外媒报道,OpenAI 下一代旗舰模型 " 猎户座 "(Orion)的性能提升幅度,小于 GPT-4 相对 GPT-3 的提升。

其创始人奥特曼曾表示,可能不会把新模型命名为 GPT-5。

多位专家劝说 AI 公司停止训练大模型," 如果当前趋势持续,人工智能很快就会耗尽其可用的训练数据。面对这种情况,AI 公司可以选择停止追求规模更大、更复杂的模型。"

AI 是当前互联网进步的主要动力之一,尤其是对搜索引擎而言,谁能突破 AI 的限制,谁就掌握了搜索市场的未来。

只是,这杯庆功酒遥遥无期。

评论
大家都在看