APPSO 07-05
黄仁勋最爱用的AI搜索,又更新了什么?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

正挣扎在盗用内容争议中的 Perplexity," 顶风 " 发布了最新的 Pro search 功能。

不知道是不是受到争议的影响,这次的更新技术细节不多,亮点在于能够更好地处理数学计算问题、编程任务等。

当然,作为看家本领,检索和回答的能力也得到提高,采用多步推理来解决复杂提问,并且展示每一个环节,让用户看到每一个步骤。

两个关于 Pro search 的重要信息:

普通用户每四小时里可以使用 5 次 Pro search,付费用户不限次数

为教育机构、政府机构、非盈利组织提供付费折扣

不过,到底有了多大提升,得试了才知道。

测试热身,考简答

为了了解 Pro search 的基本使用流程,我们先从简单的生活问题开始——各地都进入了高温天气,夏天了有什么解暑方式?

Pro search 的启动键在输入框右下角,拨动变色,即代表开启。

开启后默认保留,即便结束了一个对话,另起一个新对话时,也默认在 Pro search 模式下进行,对于不限次数的付费用户来说就很方便了。

运行后,会渐次出现 Researching 下拉框,这是模型的 " 思考工作 ",完成后可以点击右边展开键查看详情。

继续点开可以看到信息来源,算是集合了不少中文信源,来源也很多样。从回答上来看算是中规中矩," 多喝水 " 是怎么都不会出错的方法。

考数学,本轮更新重点项目

数学计算能力是本次更新的亮点,正好 Runway 更新了 Gen-3 模型,那么就让 Perplexity 来计算一下:

如果购买标准套餐,在账号里已经有 400 积分的情况下,能用 Gen-3 生成多少视频?

可以看到它摆开架势,列式子,做计算。不仅成功检索到标准套餐的费用、所提供的积分数量,也能完成加法和除法。

根据它的计算,总共能用 Gen-3 生成 102.5 秒视频,如果按 10 秒一条的顶格条件,是十支视频。那么,换算成真金白银呢,每生成十秒的视频,要花多少钱?

这里 Perplexity 出现了 " 断片 ":它能提取自己之前的计算结果,也就是 102.5 秒。可是,它却忘了第一轮计算时,套餐月费是按 12 美元 / 月计算的。

在这轮计算里,它错用了高级套餐,月费 25 美元 / 月,计算出 0.24 美元作为每秒成本。

这是个明显的失误,且不论第一轮计算时,明确指定了 " 标准套餐 ",即便是高级套餐,有折扣的年付方式折合每月是 28 美元,无折扣的月付方式直接是 35 美元——压根没有 25 美元这个数字

在追问之下,它承认自己的确搞错了价格。

考专业,深度提问

数学考试算是有惊无险吧。Perplexity 一直以来主打深度,那么专业考试表现如何呢?

正好,昨天微软研究院开源了 GraphRAG,也是一项用于 AI 搜索的技术,这不就是 Perplexity 的 " 本专业 ",那么来问问它好了。

从 searching 这一步来看,长问题会被分解成更小的问题(相比之下,上一个简单提问里,是靠变换近义词)。

第一个信源便是微软的开源页面,很即时。回答方面,Perplexity 把问题拆分成了两个小问题,做了平行回答:一是 GraphRAG 是什么,二是它自己在用的技术。

正想着追问细节之后,这一轮的免费次数已经耗尽了,得等四小时之后的刷新。

每四小时 5 次免费的额度,比每 24 小时刷新要大方。但说多也不多,必须要思考一下,怎么提问才能最有效地表达需求。倒逼用户提高自己的提问能力,这也是 AI 搜索的 " 传统艺能 " 了。

总体来说,Pro search 是一个在用户体验方面更贴心的升级

不再是僵硬的 " 输入提问 - 得到回答 ",而是能看到 Perplexity 处理问题的步骤,怎么拆分、怎么检索,调用了哪些信源。

AI 搜索的潜力股,或许是它

Perplexity 在有深度、专业性强的问题上,更能体现出实力。那么,深度提问时提到的 "GraphRAG",究竟是什么呢?

RAG 是 Retrieval(检索),Augmented(增强),Generation(生成)的缩写,是目前主流 AI 检索所使用的策略,也是 Perplexity 自己采用的方式。

局限性体现在,它像一个缝缝补补的 " 内容裁缝 "。

比如,在深度提问里,"GraphRAG 是什么?Perplexity 是如何使用 RAG 做检索?" 这两个小问,的确可以分开回答,但两者之间显然是有关联的。

传统 RAG 无法捕捉到信息之间的关联,只能僵板地罗列。对于简单提问,或许无伤大雅。但在深度提问上,在把问题分解成更小的子问题之后,却没法有机地展示这些子问题之间的联系。

GraphRAG 技术,就意在通过建立信息之间的联系。在接到问题、返送回答之间,多了一个步骤:建立知识图谱。

人类的思考能力,体现在能够把自己所知道的、所掌握的,互相勾连,形成知识图谱。

对人工智能来说,为了做到这一点,除了要完成常规的数据提取、分割,还要完成对实体的识别、提取,并围绕实体,建立一个个 " 小圈子 "。

" 小圈子 " 本身的结构是自下而上,而它们之间又彼此相关,链接在一起,就能形成一个庞大的巨网。这让后续的回答生成环节,就有了更丰富的组成方式。

图片来自:微软研究院

上图中可以看到,右边基于 GraphRAG 机制,能够根据不同的主题,进行内容整合。

这岂不是意味着 AI 又更有 " 人味儿 " 了吗?怎么 Perplexity 这次更新没有用上呢?

不着急,微软研究院 4 月时发布对于这项技术的研究,昨天才正式开源。更重要的是,这项技术,更适用于私有数据集。

例如,知乎最新发布的大模型产品 " 直答 AI",就是以知乎站内回答为优先、网络内容为补充的形态,建立的数据集。

相比之下,Perplexity 不想把自己局限住,而是放眼整个互联网。凭借海量数据和大模型能力,Perplexity 一度是英伟达掌舵人黄仁勋最爱用的产品之一。

上周,Perplexity 陷入版权争议,接连被福布斯、WIRED 点名道姓,指控它绕过媒体门户网站的反爬机制,硬是把内容抓进自己的语料库里。

AI 搜索领域,数据库 " 弹药充实 " 的确非常重要,不然 OpenAI 也不会接二连三地与各大媒体谈合作。

但另一方面,有效地理解、分析和使用搜集来的数据,将会起到越来越关键的作用。

归根到底,用户对 AI 搜索的期待,绝不仅仅是一个 " 更多、更快 " 的搜索引擎,而是 " 更强 "。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

数学 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论