本文系统介绍了上海科学智能研究院徐丽成团队提出的统一反应预测模型 RXNGraphormer 和端到端过渡态生成模型 UniTS,涵盖数据构造、模型设计、性能验证与代码演示。
📝 详细摘要
文章是《AI4S 实战派》第九期直播回顾,由魔搭社区发布。主讲人徐丽成以「用化学大模型预测催化反应」为主线,系统讲解了两个模型。首先,RXNGraphormer 是一个统一框架,能同时处理活性预测、选择性预测、反应物预测和产物预测四个任务。其核心创新包括:使用片段交换算法从 680 万条真实反应数据构造 1300 万条预训练数据(真假反应对照学习),以及引入 Delta Link 机制——通过构造反应物与产物的化学键差异图,让模型直接学习「键的成与断」。该工作登上 Nature Machine Intelligence 封面。其次,端到端过渡态生成模型 UniTS 从 300 多篇文献中提取约 4300 个高质量过渡态结构,采用高阶等变图神经网络,输入 2D 分子图即可直接生成 3D 过渡态初猜,在复杂体系上实现了从 0 到 1 的突破。文章还包含代码演示(假反应生成、产率预测、过渡态生成)和 Q&A 环节的关键判断。
💡 主要观点
- RXNGraphormer 用一个统一框架覆盖四个反应预测任务。 传统做法为每个任务(逆合成、产物预测、产率预测等)使用独立模型,RXNGraphormer 通过图神经网络 + Transformer + Delta Link 架构实现统一建模,在 16 个测评指标中 14 个达到最佳。
💬 文章金句
- 只看真反应,模型记住的是『哪些反应能成』;同时看真假反应,模型才能学会『为什么能成』。
- 化学反应的本质,说穿了就一句话:化学键的成与断。
- 在复杂体系过渡态的生成上,我们已经实现了 0 到 1 的进步。
📊 文章信息
AI 初评:87
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:16 分钟
字数:3820
标签: AI for Science, 化学大模型, 图神经网络, AI Agent, 科研自动化