智东西 03-15
学生党文献党的免费神器!通义千问上新,一键解析千万字文档
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西(公众号:zhidxcom

作者  | 程茜

编辑  | 漠影

论文季来临,不知你有没有收到导师的灵魂批注拷问?生成式 AI 赛道技术突破频发,科技小编有没有为扒论文头疼?不用怕,是时候用上最新的 AI 神器了!

智东西 3 月 15 日消息,昨天,阿里通义千问上线了一个炸裂的文档处理功能,能分分钟阅读解析万页长文档,还完全免费。

AI 正在成为用户的生产力工具。其中,长篇论文阅读、考试资料复习、超长财报分析等任务,可以说是学生党、打工人最急迫的需求,也是很多大模型应用最希望突破的能力,一年多来,国内外大模型已经陆续把文档处理能力从几万字提升到几十万字。

而人狠话不多的通义千问,一把刷新大模型读论文能力的天花板,文档处理上限直戳 "1.5 万页 ",什么概念?1.5 万页的资料换算成中文文字,约有 1000 万字, 差不多是十几本《三国演义》的体量。

那么,AI 阅读助手的真实使用体感到底如何?智东西上手体验了一把。

一、一次看懂千万字文档,秒变论文 1v1 小助手

时常接触长篇论文的莫过于学生党、科研工作者,以及从事文字工作的科技媒体等,过去,想要搞懂一篇长篇论文往往需要精心研读几个小时,但现在,通义千问新上线的文档解析功能,将这一过程的耗时大幅缩减。

文档解析功能解析文章的页数上限据说可有 1.5 万页,基本一网打尽常见的论文、书籍、技术文档、考公考研的学习资料甚至一些家用电器的使用说明书等等。

先来看这一功能支持的文件类型,在上传本地文档时,通义千问支持 PDF、Word、HTML、Markdown、EPUB、Mobi、Excel、Txt 等多种格式,涵盖不同行业用户常见的文档类型。

上传文档后,对于用户来说更有用的就是接下来的问答环节。我们以前段时间十分火爆的阿里通义实验室团队亮出的新绝活动态表情生成框架 EMO(Emote Portrait Alive)为例。

上传了这篇长达 15 页的 PDF 后,通义千问在几秒钟之内就快速总结了相应的内容,并给出了这一框架具体是什么、研究的技术创新点、研究方法等诸多论文的关键要素。

我可以继续追问它给出回答的具体来源,通义千问会指出相应问题涉及到论文中的具体部分,不过 PDF 的摘要页中未标明页码,因此没有给出具体的页数。

常规考题做完后,我尝试上难度,将一份接近 1.3 万页的 ARM 架构相关技术文档进行了上传,通义千问快速解析完这一文档后,根据文档内容给出了 A64 指令集的具体指令、解释相关字段的回答。

试想一下,用这样的逆天 AI 打辅助,人类能从阅览文档、反复检索的冗长工作中腾出多少时间!

二、同步解析上百份文件,跨文档摘要、定学习计划

除了单篇的长论文外,多篇长论文同步推进、学习也很常见。尤其是学生党写论文,往往需要研读数十篇的论文。既要迅速 get 一篇论文的研究精华,还要融会贯通找到多篇论文之间的差异与相似之处。

如今,这一难题也被文档解析助手轻松化解。

通义千问最多支持 100 份文档上传,我们随手找了三篇论文上传,让通义千问根据我的具体主题、需求,给出一些可行的写作方案;并让 AI 综合考量三篇论文的框架、目录等进行对比分析,给出选题建议。大家看看大模型列出的选题怎么样?

逆天的还不只是看文档。大家知道大模型可以实时问答,甚至还能角色扮演。考公考研或者那些准备司法、英语考试的用户,大可以把 AI 当做一对一复习助手,让 AI 学习自己的资料,跟自己做考试问答,实现定制化的 " 陪读 "。

以注册会计师考试为例,我上传了两本 CPA 会计基础课程,通义千问很快通读资料,梳理出复习要点,然后提供学习策略和方法。

我又从网上找了历年真题,让 AI 结合自己从文档中学到的知识来做题,并且给出解析,可以看到,通义千问的答案和解析都相当到位。

三、网页在线实时问答,知识创作者的 " 灵感编辑 "

对于很多患有 " 知识焦虑症 " 的人来说,通义千问最解压的功能应该是网页解析,粘贴网址就能解析文章,分分钟为信息超载的 " 万字长文 " 提取出精华,方便用户在各种碎片时间学习,等个地铁、坐个电梯的时间就能完成学习。

总而言之,这个文档神器的功能丰富、丰俭由人,想要快速使用的,打开通义千问官网和手机 APP,在主对话就能用;需要针对网页、文档、论文、图书进行分门别类研读的,可以在 APP 的频道栏找到 "AI 阅读助手 ",使用完整功能。

一个科技媒体编辑可能遇到的最典型的使用场景可能是这样的:当我打开预印本网站 arXiv,发现一篇 AI 相关的新发表论文,就将其上传到 AI 阅读助手中。随后,通义千问就会快速生成导读,包含全文的摘要、论文方法、解决的问题、相关实验、总结等可以供我快速理解其内容的部分,在右侧还对应给出了论文的原文。

当使用者变成知识内容创作者、科普博主时,他们可能更倾向于让 AI 提供一些制作文案或者内容的注意要点。

与此同时,在这些要点下方,AI 阅读助手还会给出对应论文的位置、页数。

这一手机上的功能也十分契合想要每天扩展知识面,但大段空余时间较少的用户,AI 阅读助手就可以化身指导助手,对拥有相应知识点的文章进行拆解。

对于不同的用户,长文档都是日常必不可少会遇到的文件类型,大模型的能力能大大提升他们对于文档的阅读理解效率。

结语:大模型应用,国产的香

长文档处理可以说是很多人日常生活、学习、工作的痛点需求。早期,很多人看着国外大模型的同类功能眼红,如今,像通义千问这样的国产大模型加速追赶,把单项功能做到了行业天花板,而且免费可用,超大杯无限享。国产大模型肉眼可见的进阶发展值得庆幸。

大模型应用,还是中国的香。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

通义千问 阅读 ai 阿里
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论