智东西 08-29
万物皆可“邪修”?科研党靠这个开源大模型“开挂”:能解化学题、能分析AFM图,有8B轻量版还能二次开发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 王涵

编辑 | 漠影

智东西 8 月 28 日报道,最近网上有一个词特别火,叫 " 邪修 "。

通俗来讲就是 " 不走寻常路 ",跳出传统方法或步骤,却能简单高效地达成目的。

那科研能不能 " 邪修 " 呢?

前几天,一个还在读材料研究生的朋友跟我聊天,提到他们实验室里的新生都在 " 邪修做实验 "。

具体说来就是,用 AI 帮忙总结文献,把实验结果输给 AI 让其帮忙做数据分析,还能让 AI 根据分析结果生成下一步实验改进方法,得到的结果又快又好。

现在带动他们整个实验室都在用 AI,当然老师也知道这个情况,但基本属于默许状态,还曾感叹真是生错了时代。

究竟是什么 AI 这么好用?他给我甩来一个链接,还说你试试就知道了。我点开一看,这是一个科学多模态大模型,叫做『书生』Intern-S1。

为了验证它的能力,我特意翻出了此前所做实验的相关图表,拍照发给 Intern-S1,并问它:这副材料表征图可以显示出钙钛矿 LED 薄膜的哪一特性?右图和左图在这一特性上有什么不同?

Intern-S1 在很短的时间内就判断出该幅图片是原子力显微镜(AFM)的三维形貌图,并且对该图进行了详细的解读,列出了对比表格。此外,Intern-S1 还生成了对该实验品的未来改进方向,可以给科研人员拓宽实验改进思路。

值得一提的是,在精准识别化学分子结构并进一步给出科研建议方面,Intern-S1 表现比 Grok 还出色。

我给了 Intern-S1 一张图,并提问:这个分子式含有 Cs、Pb 和 Br 三种元素,根据此分子结构图,写出该化学物质的分子式,并介绍其有什么样的化学性质,目前有哪方面的应用?

作为对比,我也让 Grok 回答了一下这个问题:

可以看到,Grok 只是中规中矩地回答问题,并没有做更多的延展,但 Intern-S1 还特别生成该化合物研究领域目前所遇到的挑战,以及未来改进方向,站在了一个科研人的角度思考问题,预判了我的下一步动作。

除了科研外,我也顺带看了一下它在艺术领域的表现。我把梵高的画作《星空》发给 Intern-S1,让它从科学的逻辑和知识体系进行理性赏析:

当然也还可以这么用,比如给理工直男解释防晒霜和隔离液、粉底液的区别:

再比如,我还能让 Intern-S1 给我看食品配料表,判断其是否适合减脂期食用:

对于我的提问,Intern-S1 在分钟内就给出了准确答案,相对于教科书和学术论文语言的晦涩,Intern-S1 的回答简洁明了、通俗易懂,并且在其他模型还在专注于如何精准地回答问题时,Intern-S1 已经可以用科研人的思维进一步思考了,在科学专业知识这方面,确实能打。

Intern-S1 的轻量化版本 Intern-S1-mini 也在前几天问世了,mini 版本只有 8B 参数但同样兼具通用能力与专业科学能力,且更加适合快速部署和二次开发。

目前,Intern-S1 和 Intern-S1-mini 都已经开源,Hugging Face 上显示 Intern-S1 的下载量有 5 万多,Intern-S1-mini 的下载量也有 1000 多,非常受欢迎,感兴趣的可以去试一试:

体验页面:

https://chat.intern-ai.org.cn/

GitHub:

https://github.com/InternLM/Intern-S1

HuggingFace:

https://huggingface.co/internlm

ModelScope:

https://modelscope.cn/models/Shanghai_AI_Laboratory

当然,科学大模型不算是一个新鲜事物。在近几年,同类型的、专注于科学的大模型也层出不穷。上海 AI 实验室的这一成果为什么能实现这样的差异化?

带着这样的疑问,我深扒了 Intern-S1 背后的技术路线和应用成果,并与上海 AI 实验室的青年领军科学家陈恺进行了一场深度访谈,最终我得到了答案。

一、AlphaFold 破解 50 年蛋白质难题,AI+Science 进入快车道

要讲科学大模型,最绕不开的就是 AI for Science 这个话题,这就不得不提到 2024 年的诺贝尔化学奖。

2024 年,诺贝尔化学奖公布将其一半颁给计算蛋白质设计方面的研究者 David Baker,另一半则授予了共同开发了 AlphaFold 的谷歌 DeepMind CEO 德米斯 · 哈萨比斯(Demis Hassabis)和 John Jumper。

AlphaFold,特别是其在 2020 年发布的 AlphaFold2 版本,利用深度学习和人工智能技术,以前所未有的准确性和速度预测蛋白质的三维结构。这使得原本需要数月甚至数年才能完成的蛋白质结构解析工作,现在可以在几小时甚至几分钟内完成,并且准确度可以媲美甚至在某些情况下超越传统方法。

AI 可以通过分析数百万个已知的蛋白质结构和序列数据库进行训练,从而能够从仅有的氨基酸序列推断出蛋白质的折叠方式。

其实在此之前,AI for Science 就已经引起学术和行业的关注。2019-2023 年间,全球 AI for Science 论文发表年均增长率为 27.2%,各学科领域论文发表均呈现逐年递增趋势,其中生命科学、物理学和化学等领域发表的人工智能应用论文数量最多。

中美两国是当前 AI for Science 研究大国,近 5 年间,中国论文发表超过 10 万篇,居全球第一。

但 24 年诺贝尔化学奖的公布,再次证明了人工智能技术在推动科学进步方面所扮演的关键角色,尤其是通过像 AlphaFold 这样的突破性应用,不仅加快了科学研究的步伐,还拓宽了我们对生命科学、物理学和化学等领域内复杂问题的理解。

随着全球范围内 AI for Science 的热度持续升温,越来越多的研究者和机构开始探索如何利用人工智能来解决更多基础科学难题。

在这一背景下,『书生』科学多模态大模型 Intern-S1 应运而生。

值得关注的是,在开源策略层面,上海 AI 实验室比谷歌 DeepMind 更 " 豪爽 "。

Intern-S1 发布即开源。除了基础模型外,上海 AI 实验室还一口气开源了大模型研发与应用所需的全链路工具体系,并已构建拥有数十万活跃开发者的开源社区。

谷歌 DeepMind AlphaFold3 从发布到开放相隔长达半年,且仅为部分开放:模型权重需申请获取,商业用途受限。

二、主打多模态和通专融合,化学、材料、地球科学全面超越 Grok-4

相较于同类科学大模型,Intern-S1 有 2 个突出的特别之处,那就是多模态和 " 通专融合 "。

据了解,在综合多模态通用能力评估中,Intern-S1 的得分和国内外一流模型不相上下,能同时较好地理解文本和图像内容。该评估为多项通用任务评测基准均分,这样的结果说明它在不同场景任务中,既有稳定的表现,也能适应复杂情况。

而在由多个领域专业评测集组成的科学能力测试里,Intern-S1 的表现超过了 Grok 4 等最新的闭源模型。这些评测涉及物理、化学、材料、生物等领域的复杂专业任务,进一步证实了 Intern-S1 在科研场景中具备较强的逻辑性和准确性。

Intern-S1 是怎么在多模态领域答出这样的高分答卷的?

陈恺告诉智东西,原来,Intern-S1 新增了动态 Tokenizer 和时序信号编码器,实现了支持多种复杂科学模态数据处理的功能,所以才能够实现材料科学与生物制药、天文巡天、天体碰撞、地震台网记录的地震波形等多类科学模态进行深度融合。

此外,Intern-S1 通过架构上的创新,对科学模态数据的理解和处理效率有了明显提高。比如,它对化学分子式的压缩率比 DeepSeek-R1 要高出 70% 以上。在一系列基于科学模态的专业任务中,Intern-S1 不仅用的算力更少,表现也更出色。

之前市场中的科学大模型,或者说专业领域的行业大模型,通常都会强调自己过硬的专业能力,而在 Intern-S1 发布会上," 通专融合 " 这个词出现频率很高。

当被问到上海 AI 实验室专注走 " 通专融合 " 技术路线的原因时,陈恺解释称:" 通专融合的技术路线,能让模型在通用能力保持的同时做到专业能力精进,把垂类能力构建成本大幅降低。"

智东西了解到,一方面,Intern-S1 会借助大量通用科学数据来拓宽自身的知识范围;另一方面,它还会训练多个专业模型,生成那些容易理解、逻辑清晰的科学数据,并且通过为特定领域定制的专业验证智能体来把控这些数据的质量。

这种闭环的运作方式不断为其基座模型提供支持,让 Intern-S1 既能拥有强大的通用推理能力,又具备多项专业能力,从而实现了 " 一个模型就能解决多项专业任务 " 这一科学智能领域的突破。

跳出技术角度,陈恺特别补充,科学领域的前沿突破,往往需要不同专业能力的交叉融合迁移,通专融合能更好促进未来科学发现。

陈恺还介绍,Intern-S1 的研发团队在训练系统和算法两方面一起下功夫搞创新,成功让大型多模态 MoE(混合专家)模型在 FP8 精度下,能高效又稳定地进行强化学习训练,而且训练成本比最近公开的其他 MoE 模型低了 10 倍。

从系统层面来看,Intern-S1 用了训推分离的 RL 方案,靠自己研发的推理引擎来进行 FP8 精度的大规模异步推理,效率很高;还通过数据并行均衡策略,减轻了长思维链解码时出现的长尾问题。训练的时候用了分块式 FP8 训练,效率提升不少,这套训练系统之后也会开源。

再看算法方面,基于 Intern · Bootcamp 搭建的大规模多任务交互环境,研发团队提出了 "Mixture of Rewards" 混合奖励学习算法,能把多种奖励和反馈信号融合到一起,听起来有点像 " 因材施教 "。

比如在容易验证的任务上,就用 RLVR 模式来训练,通过规则、验证器或者交互环境来提供奖励信号;而像对话、写作这类不好验证的任务,就用奖励模型给出的奖励信号来一起训练。

三、能查科研数据,还能联机实验设备,科学发现平台同步推出

在落地应用上,智东西发现,以 Intern-S1 为底座的『书生』科学发现平台 Intern-Discovery 也同步推出了。

Intern-Discovery 以 Intern-S1 为核心,整合了专业智能体、海量科研数据及实验设备,可以给全球研究者提供从假设到验证的一站式科研支撑,目前平台已开放全球试用申请。

陈恺向智东西透露,实验室非常欢迎与各大高校和研究所等机构进行深度合作。

根据公开信息,在 Intern-Discovery 的基础上,上海 AI 实验室联合临港实验室、上海交通大学、复旦大学、MIT 等研究机构,共同参与构建了多智能体虚拟疾病学家系统 " 元生 "(OriGene)。

在治疗癌症上,OriGene 的作用非常大。目前,其仅用了两个月就已在肝细胞癌和全球第三大癌症的结直肠癌治疗上分别提出两个新靶点 GPR160 和 ARG2,并已在临床样本、类器官和人源化动物实验中得到验证。

结语:Intern-S1 展现 AI 赋能科学新图景

随着技术的持续迭代,科研人员与 AI 工具的协同将进一步深化。通用大模型与专用模型的优势互补,可能在更多科学领域发挥作用。

Intern-S1 所采用的 " 通专融合 " 技术路径,为平衡模型的通用性与专业性提供了一种实践方案,AI 技术与科学研究的结合不断拓展着科研手段的边界。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

科研 ai 数据分析
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论