IT 之家 10 月 28 日消息,自去年谷歌推出饱受诟病的 "AI 概览 "(AI Overviews)功能以来,公众已普遍意识到:由人工智能驱动的搜索结果,与搜索引擎数十年来提供的传统链接列表存在巨大差异。如今,一项新的研究量化了这种差异,揭示出 AI 搜索引擎倾向于引用那些访问量较低、甚至在传统谷歌搜索的前 100 名结果中都难以出现的网站。

IT 之家注意到,在题为《生成式人工智能时代的网络搜索特征分析》("Characterizing Web Search in The Age of Generative AI")的预印本论文中,德国波鸿鲁尔大学(Ruhr University in Bochum)与马克斯・普朗克软件系统研究所(Max Planck Institute for Software Systems)的研究人员将谷歌传统搜索结果与其 AI 概览(AI Overviews)、Gemini 2.5-Flash 进行对比,并纳入了 GPT-4o 的网页搜索模式以及 "GPT-4o 搭配搜索工具 "(即仅在大语言模型判断需要外部信息时才调用网络搜索)的表现。
研究人员从多个来源选取测试查询语句,包括 "WildChat" 数据集中用户向 ChatGPT 提出的具体问题、AllSides 平台上列出的政治议题,以及亚马逊上被搜索次数最多的 100 种商品。
研究发现,生成式 AI 搜索工具所引用的信息来源,其所在网站的受欢迎程度往往低于传统搜索前 10 名的网站,这是根据域名追踪工具 Tranco 的测量结果得出的。相较于传统谷歌搜索结果中的链接,AI 引擎引用的网站更有可能不在 Tranco 统计的全球前 1,000 名或前 1,000,000 名域名之内。其中,Gemini 搜索尤为明显:其引用来源的中位数排名落在 Tranco 前 1,000 名之外,表明其高度依赖不常见的网站资源。
此外,AI 搜索引擎引用的内容往往在相同关键词的传统谷歌搜索结果中几乎不会出现在靠前位置。例如,在谷歌 AI 概览引用的来源中,有 53% 并未出现在对应查询的传统谷歌搜索前十名结果中;更有 40% 的来源甚至未进入前 100 名。
当然,这些差异并不意味着 AI 生成的结果就一定 " 更差 "。研究发现,基于 GPT 的搜索更倾向于引用企业官网和百科类网站作为信息源,而几乎从不引用社交媒体内容。
一项基于大语言模型的分析工具显示,AI 搜索结果所涵盖的可识别 " 概念 " 数量,与传统搜索前十条结果相当,说明两者在信息细节、多样性与新颖性方面水平相近。但与此同时,研究人员也指出:" 生成式引擎往往会对信息进行压缩,有时会省略次要或模糊的内容,而这些内容在传统搜索结果中仍得以保留。" 这一点在面对含义模糊的搜索词(如多名公众人物共用的名字)时尤为突出,此时 " 传统搜索结果的信息覆盖更为全面 "。
另一方面,AI 搜索引擎也有其优势 —— 它们能够将预训练获得的 " 内部知识 " 与引用网页中的信息相结合。这一点在 "GPT-4o 搭配搜索工具 " 中表现得尤为明显:该模式常常不提供任何外部引用链接,而是直接基于自身训练数据给出答案。
然而,这种对预训练数据的依赖在查询时效性强的信息时也可能成为短板。当研究人员使用谷歌 9 月 15 日 " 实时热搜榜 " 中的关键词进行测试时,发现 "GPT-4o 搭配搜索工具 " 经常回应诸如 " 您能否提供更多详细信息?" 之类的提示,而非主动搜索最新的网络资讯。
尽管研究人员并未最终判定 AI 搜索引擎整体上优于或劣于传统搜索链接,但他们呼吁未来应加强对生成式搜索系统的评估方法研究,强调需综合考虑信息来源的多样性、概念覆盖的完整性,以及信息整合能力等维度,以建立更科学的评价体系。
 
    

登录后才可以发布评论哦
打开小程序可以发布评论哦