Nature子刊:人工智能可以设计任何化合物的最佳合成路径?中山大学陈语谦团队提出一种端到端图生成架构用于逆合成预测

时间:2023-05-28 20:46:29   热度:37.1℃   作者:网络

逆合成是有机化学家广泛使用的一种方法,通过将目标分子递归分解为更简单的前体分子来设计目标化合物的合成路线。逆合成预测是一个一对多的问题,即合成同一个目标分子可能存在多个反应方法,而由于所有可能的化学转化的巨大搜索空间,即使对于经验丰富的化学家也极具挑战性。因此,如何从化学家思考的角度利用AI实现任何化合物都可以逆合成预测算法提升模型预测的精度和可解释性,对于分子的合成路线设计至关重要。

2023年5月25日,中山大学陈语谦团队在Nature Communications发表了题为“Retrosynthesis prediction using an end-to-end graph generative architecture for molecular graph editing”的研究论文。该研究基于反应转化的简易机理提出了一种基于图神经网络的图到编辑架构Graph2Edits,用于逆合成预测。

该研究表明,Graph2Edits的设计策略可以增强逆合成反应预测模型的合理性和可解释性,与其他先进的基线模型相比表现出更高的预测性能,并在一些复杂反应中具有较高的适用性,可以进一步用于药物分子的合成路线设计。

图片

在药物发现的分子设计-合成-测试的循环中,小分子的化学合成一直是阻碍其效果验证和影响成功率的一个重要因素。近年来,随着AI技术的快速发展和化学反应数据的积累,基于深度学习的计算机辅助合成规划(CASP)方法如雨后春笋般涌现,可以帮助化学家在设计合成实验时节省大量时间和精力。然而,目前逆合成模型在预测精度、多样性以及可解释性等方面的局限性限制了其在合成路线规划中的实际应用因此,如何从化学家思考反应发生的角度出发提升基于AI的逆合成预测模型的效果和适用性仍然是一个迫切重要的研究课题。

图片

Graph2Edits的设计动机(简化的反应机理)与整体架构

基于反应转化的简易机理,研究提出了一种新的基于端到端半模板的逆合成反应预测模型Graph2Edits。具体地说,模型将逆合成反应预测表示为通过一系列相互关联的图编辑来完成产物-中间体-反应物推导的过程来学习反应转化的规则,就像化学家思考反应是如何发生的一样;端到端的模型架构以自回归的方式生成任意长度的图编辑序列,能够增强多个生成步骤之间的紧密联系,提高其在多中心反应中的适用性和预测的多样性;使用定向消息传递神经网络D-MPNN对局部原子/键和全局图特征进行编码以充分利用化合物的结构信息来预测原子/键编辑和生成终止符,并将作为离去基团的子图添加到中间体完成反应物的生成以贴近更真实的反应转化过程,可以显著减少生成步骤,提升其预测性能。

实验表明,与基准模型相比,Graph2Edits在不同评估方法中实现了更高的逆合成预测精度,top-1精确匹配精度达到了55.1%,能够有效地搜索合理反应的潜在空间,显示出在复杂反应中优秀的适用性和泛化能力,提高了预测结果的多样性和可解释性。

图片

图片

Graph2Edits在多步逆合成反应路线预测的应用

为了验证模型在合成路线规划中的实际用途,该研究选择了3个重磅药物分子作为例子进行合成路线的设计,包括用于治疗COVID-19的口服SARS-CoV-2 Mpro抑制剂奈玛特韦(Nirmatrelvir),用于治疗非小细胞肺癌的第三代EGFR抑制剂奥希替尼(Osimertinib)和用于治疗多发性骨髓瘤的来那度胺(Lenalidomide)。结果显示,Graph2Edits模型成功地预测了这些药物分子的完整合成路线,验证了其在分子的多步逆合成路线设计中潜在的实际应用价值。

论文链接:

https://www.nature.com/articles/s41467-023-38851-5

上一篇: 司美格鲁肽等新型减肥药日益流行,究竟哪些...

下一篇: ADC:产前母体营养补充与子代2岁时神经...


 本站广告