← 回總覽

《AI4S 实战派》第九期回顾|一个模型统一四种预测任务:RXNGraphormer 与端到端过渡态生成的技术拆解

📅 2026-06-03 16:35 魔搭ModelScope社区 人工智能 2 分鐘 1636 字 評分: 87
AI for Science 化学大模型 图神经网络 AI Agent 科研自动化
📌 一句话摘要 本文系统介绍了上海科学智能研究院徐丽成团队提出的统一反应预测模型 RXNGraphormer 和端到端过渡态生成模型 UniTS,涵盖数据构造、模型设计、性能验证与代码演示。 📝 详细摘要 文章是《AI4S 实战派》第九期直播回顾,由魔搭社区发布。主讲人徐丽成以「用化学大模型预测催化反应」为主线,系统讲解了两个模型。首先,RXNGraphormer 是一个统一框架,能同时处理活性预测、选择性预测、反应物预测和产物预测四个任务。其核心创新包括:使用片段交换算法从 680 万条真实反应数据构造 1300 万条预训练数据(真假反应对照学习),以及引入 Delta Link 机制—

📌 一句话摘要

本文系统介绍了上海科学智能研究院徐丽成团队提出的统一反应预测模型 RXNGraphormer 和端到端过渡态生成模型 UniTS,涵盖数据构造、模型设计、性能验证与代码演示。

📝 详细摘要

文章是《AI4S 实战派》第九期直播回顾,由魔搭社区发布。主讲人徐丽成以「用化学大模型预测催化反应」为主线,系统讲解了两个模型。首先,RXNGraphormer 是一个统一框架,能同时处理活性预测、选择性预测、反应物预测和产物预测四个任务。其核心创新包括:使用片段交换算法从 680 万条真实反应数据构造 1300 万条预训练数据(真假反应对照学习),以及引入 Delta Link 机制——通过构造反应物与产物的化学键差异图,让模型直接学习「键的成与断」。该工作登上 Nature Machine Intelligence 封面。其次,端到端过渡态生成模型 UniTS 从 300 多篇文献中提取约 4300 个高质量过渡态结构,采用高阶等变图神经网络,输入 2D 分子图即可直接生成 3D 过渡态初猜,在复杂体系上实现了从 0 到 1 的突破。文章还包含代码演示(假反应生成、产率预测、过渡态生成)和 Q&A 环节的关键判断。

💡 主要观点

- RXNGraphormer 用一个统一框架覆盖四个反应预测任务。 传统做法为每个任务(逆合成、产物预测、产率预测等)使用独立模型,RXNGraphormer 通过图神经网络 + Transformer + Delta Link 架构实现统一建模,在 16 个测评指标中 14 个达到最佳。

片段交换算法通过构造「假反应」提升模型对反应本质的理解。 将真实反应的产物结构打乱重排生成大量不会发生的假反应,让模型在真假对照中学习「为什么能成」,而非仅记忆「哪些能成」,有效扩充预训练数据至 1300 万条。
Delta Link 机制直接编码化学键的成断差异。 通过计算反应物与产物的化学键差异图,将「变化」直接呈现给模型,显著提升反应性能预测精度,是架构中最具洞察力的设计。
高阶等变图神经网络是复杂体系过渡态生成的关键。 在数据复杂且稀疏(仅约 4300 个高质量结构)的条件下,低阶模型(如 EGNN)生成的结构会碎裂,高阶等变模型能捕捉更精细的多体几何关系,实现端到端生成合理 3D 过渡态初猜。
模型定位为替代化学家手工搭建初猜,而非替代 DFT 计算。 模型生成过渡态初猜,最终仍需 DFT 优化校验,但能大幅节省化学家在复杂体系上手搭结构的时间,实现从 0 到 1 的突破。

💬 文章金句

- 只看真反应,模型记住的是『哪些反应能成』;同时看真假反应,模型才能学会『为什么能成』。

  • 化学反应的本质,说穿了就一句话:化学键的成与断。
  • 在复杂体系过渡态的生成上,我们已经实现了 0 到 1 的进步。

📊 文章信息

AI 初评:87

来源:魔搭ModelScope社区

作者:魔搭ModelScope社区

分类:人工智能

语言:中文

阅读时间:16 分钟

字数:3820

标签: AI for Science, 化学大模型, 图神经网络, AI Agent, 科研自动化

阅读完整文章

查看原文 → 發佈: 2026-06-03 16:35:00 收錄: 2026-06-04 04:00:35

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。