IT 之家 4 月 17 日消息,OpenAI 周四宣布推出 GPT-Rosalind,这是一款专为生物学工作流训练的大语言模型。与谷歌、微软等科技巨头推出的通用科学模型不同,GPT-Rosalind 走垂直路线,专注于生物学领域。


在发布会上,OpenAI 生命科学(Life Sciences Research)产品负责人王昀昀(Yunyun Wang)表示,该模型目的是解决生物学研究者面临的两大核心障碍:数十年基因组测序积累的海量数据,以及高度细分的专业术语壁垒。
生物学研究正面临信息过载困境。一位专注于特定基因的遗传学家,在面对海量的神经生物学文献时往往束手无策。
IT 之家援引博文介绍,OpenAI 针对这一痛点,在通用大模型基础上,引入 50 种常见生物工作流,以及主流公共数据库访问能力,通过专项训练让模型能够通过已知通路和调控机制连接基因型与表型,推断蛋白质的结构或功能属性,并据此筛选潜在药物靶点。

为了抑制大语言模型常见的 " 阿谀奉承 " 倾向,OpenAI 针对性调整 GPT-Rosalind,让其更具批判性思维。当面对低价值靶点时,模型更倾向于直接否定而非盲目附和。
幻觉问题仍是悬而未决的挑战。大语言模型在解释推理步骤时,可能生成看似合理实则错误的内容,这在严谨的科学研究中风险极高。
基于过往经验,该模型既可能会产出令人惊喜的意外关联,也会给出明显错误的建议。OpenAI 坦言尚未完全解决这一顽疾,用户需保持审慎态度。
生物安全风险是另一重考量。若被恶意利用以优化病毒传染性,后果不堪设想。因此 OpenAI 实施严格的访问限制,目前仅限美国本土实体通过可信访问部署框架申请使用。同时,功能受限的生命科学研究插件将面向更广泛用户开放。
OpenAI 联合创始人 Greg Brockman 表示,GPT-Rosalind 是 OpenAI 用于生命科学研究的前沿模型,朝着加速科学发展和改善人类福祉这个目标迈进。



登录后才可以发布评论哦
打开小程序可以发布评论哦