OpenAI的新AI模型Rosalind可能会缩短药物发现的时间。你可能无法使用它

简要概述

  • OpenAI 发布了 GPT-Rosalind 以加速药物发现流程。
  • 基准测试显示出强劲的提升,但在实际应用中的影响仍有限。
  • 在日益增长的生物安全担忧下,访问权限受到严格限制。

OpenAI 刚刚以 Rosalind Franklin 的名字命名了其首个领域专用的 AI 模型——这位英国化学家通过 X 射线晶体学工作帮助揭示了 DNA 的双螺旋结构,生前未被给予应有的荣誉。 GPT-Rosalind 于周四公布,是一款专为生物学、药物发现和转化医学设计的推理模型。这是 OpenAI 所称的生命科学模型系列的第一款——这是在许多从大学到谷歌 DeepMind 等专业实验室都在争夺市场份额的背景下的直接布局。 专家指出,将药物从靶点发现到美国监管批准平均需要 10 到 15 年。大部分时间并不在灵光一现的瞬间,而是在繁琐的工作中:解析数千篇论文、查询数据库、设计试剂、解释模糊的结果。这正是 GPT-Rosalind 试图解决的问题。 OpenAI 认为该模型可以压缩早期工作流程。公司表示,GPT-Rosalind 旨在帮助科学家“探索更多可能性,发现可能被遗漏的联系,并更早得出更好的假设”。

 基准测试至少部分验证了这一目标。在以真实生物信息学任务为基础的基准测试 BixBench 上,GPT-Rosalind 的通过率为 0.751,是已公布结果模型中的最高分。在 LABBench2 上,它在十一项任务中有六项优于前一版本 GPT-5.4。 GPT-Rosalind 在所有涉及生命科学的案例中都优于 GPT 5.4,但它是一个高度专业化的模型,在其他领域表现可能不佳。

OpenAI 还宣布,Dyno Therapeutics 将协助测试和评估其模型,基于未公开的 RNA 序列,以排除记忆化的可能性。GPT-Rosalind 在十次提交中的最佳表现排名高于人类专家的 95 百分位,在生成任务中约为 84 百分位。 不过,OpenAI 的生命科学研究负责人 Joy Jiao 对模型的实际能力持谨慎态度。她解释说,公司并不认为 Rosalind 能自主创造新疗法,但告诉记者,它可以极大加快研究进程。“我们确实看到帮助研究人员更快完成科学过程中一些最复杂、耗时部分的巨大潜力,”Jiao 在一次新闻发布会上表示,《洛杉矶时报》报道。 模型周围的生态系统可能与模型本身一样重要。OpenAI 还发布了一个免费的生命科学研究插件,连接 Codex,涵盖超过 50 个科学数据库和工具——蛋白质结构查询、序列搜索、文献综述、基因组学流程。拥有 GPT-Rosalind 访问权限的企业用户可以在此基础上获得推理层,其他用户则使用标准模型的插件。 OpenAI 已为此次发布列出了一批制药和生物技术客户,包括安进(Amgen)、Moderna 和 Thermo Fisher Scientific。此外,还与洛斯阿拉莫斯国家实验室合作进行 AI 指导的蛋白质和催化剂设计研究。 “生命科学领域对每一步都要求精准。问题高度复杂,数据极为独特,风险也极其高,”安进的 AI 和数据高级副总裁 Sean Bruich 在官方公告中表示。 对 Rosalind 的访问被刻意限制。该模型仅面向美国企业,需经过资格和安全审查。担忧并非空穴来风:已有一个由 100 多名科学家组成的国际联盟呼吁加强对用于训练 AI 的生物数据的控制,担心涉及病原体设计的风险。OpenAI 的限制性推广正是对此的直接回应。在研究预览期间,使用不会消耗现有的 API 额度。 这也不是 OpenAI 首次涉足科学工作流程。1 月推出的 Prism 科学写作工作空间是一个起步。GPT-Rosalind 更加精准、专业,标志着领域专用模型正成为激烈的竞争前沿。 目前还没有完全由 AI 发现的药物通过三期临床试验,数字仍为零。但如果 GPT-Rosalind 能帮助研究人员在数千个实验室中提前六个月设计出更好的实验,那么其对发现和时间的积累效应可能会改变整个局面。这才是核心目标,也值得密切关注。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论