现代有机化学中的大多数实验都需要使用文献中的方法预先制备反应物,如果能将其中最常见的合成工作自动化,无疑可以为化学家节省大量时间和精力。目前,已经有基于不同策略的化学合成自动化平台已建立起来,如UIUC的Martin Burke课题组基于迭代偶联的合成机器(Science, 2015, 347, 1221,点击阅读详细)、Pfizer的基于流动化学的自动化系统(Science, 2018, 359, 429,点击阅读详细)以及英国格拉斯哥大学Leroy Cronin课题组的基于传统化学实验流程的Chemputer合成机器(Science, 2019, 363, eaav2211)。
近日,Leroy Cronin课题组进一步完善他们发展的自动化合成机器,并在Science 上发表了他们的研究新进展。此项工作中,他们构建了包含103个分子的可自动化执行化学反应数据库,并使用自动合成平台Chemputer对其中53个分子进行了实验验证,所达到的产率和纯度与专业化学家相当。该数据库涉及当代有机合成中多种常用反应,包括过渡金属催化的偶联反应、杂环形成、官能团相互转化和多组分反应,具体的反应合成操作步骤通过化学反应代码(chemical reaction codes)的形式存储在数据库中。此外,他们还使用能与平台无缝衔接的色谱模块(使用相同语言编程)自动纯化了一系列化合物。
Chemputer自动进行合成反应
此前,Chemputer已证明一系列不同的分子可以在相同的硬件上自动合成。然而,整合现有的不同自动化策略仍是领域内的重大挑战。作者认为,需要一种允许系统可编程和模块化的通用方法将各种合成步骤统一起来,从而能够自动合成绝大多数可人工合成的分子。此外,为了充分利用自动化合成机器以及保证合成步骤的可重复性,需要满足两方面要求:一是拥有能完成所有合成所需单元操作的通用型自动合成平台;二是需要有标准化的“语法”(编程代码)来准确描述合成操作。而且这种代码必须与硬件无关,使其可以成为统一描述代码。
本工作中,作者构建了从文献中提取合成操作步骤并转化为化学描述语言(Chemical Description Language, χDL)的工作流程,将χDL传到ChemPU(Chemical Processing Unit,类似普通计算机的CPU)则可以自动按照定制的操作流程合成分子。他们用χDL编码了从文献中收集而来的103个应用广泛的化学反应,并对其中的53个反应进行了自动化合成验证,得到与文献报道一致的产率和纯度。而此前版本的ChemPU并不能与χDL兼容。此外,根据具体的反应实例,χDL可以调整如温度和反应时间等关键参数,且通过与色谱模块的结合可以达到真正意义上的自动合成并分离产物。
图1. χDL协议优化示意图。图片来源:Science
如图1所示,作者展示了将文献中的反应步骤转为χDL数据库的工作流程。与此前的策略相比,χDL并不单纯机械地记录某个反应具体的操作过程,而是将其转化为定制的单元操作,从而在不同的反应实例中提高效率。化学反应会被χDL记录为具体的物理过程如加料、溶解、蒸发等。目前χDL记录了44个单元操作,如“在真空中反应”、“液液分离”等,每个单元操作有详细的定制参数。作者还使用了ChemIDE(类似普通计算机常用的IDE)辅助从文本产生χDL的过程。χDL的优势是用户使用相同的χDL代码会得到同样的结果。当χDL代码能达到满意的结果时,该代码会收集到数据库中供公开下载使用。χDL数据库会保存操作步骤、实验结果和相关的分析。ChemIDE同时会展示每个实验的特征参数,如产量、产率、状态(未验证/成功/失败)和反应时间等。用户可以上传、搜索、下载和复现可靠的合成结果。数据库中除了提供最后成功的版本,还会包括此前失败的开发版本。通过对比成功和失败的版本可以揭开合成步骤的关键要点。本文报道的χDL代码都是经过ChemPU验证过的,但数据库中含有未验证的合成步骤。通过模拟人工合成的工作流程,ChemPU已经证明其可以作为通用的、可编程的自动合成硬件平台。
图2. ChemPU的组成。图片来源:Science
自动合成的第一步是分析反应所需的基本单元操作。一旦确定了这些单元操作,通过软件接口,就可以将每个单元操作连接到相应的硬件模块。ChemPU模拟手动批处理化学工作流程并使用许多典型的实验室硬件。常用的实验室硬件包括液体处理系统(由一系列泵和阀门组成,在不同单元之间传输试剂、溶剂和中间体溶液)、圆底烧瓶(用作反应器)、电导传感器(检测相界)和旋转蒸发仪(浓缩馏分)等。
图3. ChemPU的物理布局和可用硬件库的图形示意。图片来源:Science
为了检验χDL语言和ChemPU平台的实用性,作者从文献中选择常用的有机化学反应,包括在药物化学和天然产物全合成中常用到的反应,例如过渡金属催化的碳碳键形成反应(包括Suzuki、Heck和Sonogashira等人名反应)、非金属催化的碳碳键形成反应(包括Wittig反应、傅-克烷基化等)、氧化还原反应(Jones氧化等)、官能团转换(Mitsunobu反应)、保护/去保护反应和多组分反应(Ugi反应和串联反应)等。图4A展示了每个反应类的示例数。一旦文献的操作步骤被“翻译”为χDL程序,会被标记为“已翻译”。当χDL程序在ChemPU上成功执行时,也就是在实验室中自动化合成验证之后,它被移动到χDL脚本的“已验证”类。“已验证”的χDL程序还可以用来构建化合物库,作者以α-酰基氨基酰胺为例,只需对程序进行简单的参数修改即可合成四个同类分子。ChemPU得到的反应产率与文献报道的相当,部分反应的具体参数和产率如图5所示。为了进一步检验平台的多功能性,作者用阿托品(一种抗胆碱能药物)作为测试,该分子可在ChemPU平台上以四步合成。
图4. 将常用反应转换为χDL并在ChemPU上进行验证。图片来源:Science
图5. 在ChemPU上验证的χDL程序的代表性示例。图片来源:Science
色谱分离(俗称“过柱子”)是中小规模反应产物纯化的首选方法。然而,“过柱子”需要大量的手工操作。为了将色谱系统整合到ChemPU,作者建立了两个辅助硬件单元:一是允许在ChemPU中预安装不同色谱柱的转盘和接馏分的托盘;二是允许ChemPU回收产物馏分。通常,化学家需要在色谱分离后通过TLC、质谱或NMR分析单个馏分,但这些常规手段很难自动化。作者认为在反应产率较高的情况下,通过紫外/可见响应和弹性光散射检测器的信号,选择AUC曲线下面积最大的峰,一般可以正确识别产物峰。这种方法的好处是灵活方便,不需要预先知道产物的保留时间,也不需要依赖质谱或NMR。如图6所示,色谱纯化的具体流程为:1)优化商业色谱单元的运行参数(ChemPU预定义);2)运行准备(梯度的基线校正和柱平衡);3)进样;4)收集产物。在梯度运行期间,色谱仪将检测器信号实时发送到ChemPU控制器,控制器执行峰值检测并触发色谱机的馏分收集机制。当分离运行完成时,产物峰被识别并转移到下一个模块(通常是旋转蒸发仪)。值得注意的是,色谱柱分离的参数也是由χDL程序定义好的,因此可以很方便复现。
图6. 色谱分离模块。图片来源:Science
小结
本文展示了如何将化学合成文献轻松转换为通用化学代码,该代码可以在任何能够进行化学计算的自动合成平台上运行,只要该平台包含反应器、分离器、蒸发器和纯化系统。这意味着不同的合成机器人能够使用相同的χDL程序来产生相同的结果。χDL程序数据库的使用不仅有助于复制已发布的程序,而且还为化学家们提供了丰富的、“已验证”的数据来源,这些数据适合于机器学习,可用于反应优化、路线规划、提高合成的安全性和减少对环境的影响,同时能大大减少实验化学家的重复劳动。
简评
相比于之前的自动合成机器的工作,笔者认为本文最大的亮点是进一步建立了标准化的化学合成代码(χDL)开源社区,有望解决合成实验的可重复性问题。该团队一直致力于从硬件和软件两个方面来标准化化学合成,硬件包括ChemPU及其配套的液体处理系统和色谱纯化系统,软件则是以χDL程序和ChemIDE为代表。从目前文章展示的结果来看,似乎大部分常规的化学合成都可以通过该团队的硬件+软件平台来标准化。笔者认为,该团队未来可能会朝两方面发力:一是扩展反应模块库,如支持低温(−78 °C)、光化学和电化学的模块;二是扩大平台的影响力,让更多化学实验室开始尝试接受。根据该团队此前的估计,ChemPU的单价在2万英镑左右,应该不算特别贵,但推广ChemPU自动合成的应用范围应该是该课题组未来工作的重点方向之一。
Digitization and validation of a chemical synthesis literature database in the ChemPU
Simon Rohrbach, Mindaugas Šiaučiulis, Greig Chisholm, Petrisor-Alin Pirvan, Michael Saleeb, S. Hessam M. Mehr, Ekaterina Trushina, Artem I. Leonov, Graham Keenan, Aamir Khan, Alexander Hammer, Leroy Cronin
Science, 2022, 377, 172–180, DOI: 10.1126/science.abo0058
(本文由Alchemy供稿)
留言与评论(共有 0 条评论) “” |