英文原题:Slicing and Dicing: Optimal Coarse-Grained Representation to Preserve Molecular Kinetics
通讯作者:Cecilia Clementi
作者:Wangfei Yang (杨王飞), Clark Templeton, David Rosenberger, Andreas Bittracher, Feliks Nüske, Frank Noé, Cecilia Clementi
背景介绍
数值模拟在生物大分子及凝聚态物质等复杂系统的研究中已经成为了十分有力的工具,用于帮助人们了解无法直接被实验所观测到的过程。基于经验以及统计力学,大量重要的生物分子过程实际上都可以被一个较低分辨的模型所很好地描述。事实上,粗粒化模型也的确已经通过用一个等效原子替代多个原子的方法实践了这一论点。构建粗粒化模型的第一步是确定粗粒化映射,即确定在粗粒化过程中哪些自由度将得到保留。这一过程长期以来往往只取决于科学家的化学直觉。传统的基于粗粒化模拟结果的评价方式也难以将粗粒化映射的优劣与其相应力场的影响分离开。直到近几年,陆续有评价粗粒化映射优劣的方法被提出。最近,该课题组提出了在软物质体系中,好的粗粒化模型应当能够最大限度保留系统的长时间尺度动力学特征。基于此,该组提出了一种评价粗粒化映射的方法,并将其与其他多种现有方法作了比较。
文章亮点
1
提出了用保留长时间尺度动力学特征的程度来评价粗粒化模型优劣的论点。
2
在实践中,基于Variational Approach for Markov Processes (VAMP) Score实现了对不同粗粒化映射的定量评价。
3
通过在不同系统中与现有多种粗粒化映射评价方法进行对比,验证了基于VAMP Score得到的最佳映射的确能最大限度保留系统的长时间尺度动力学特征。
图文解读
本文中,除了新提出的基于VAMP Score的粗粒化映射评价方法,作者还将基于映射熵(mapping entropy)、振动能力(vibrational power)以及自编码器(auto-encoder)重构全原子结构的误差(reconstruction error)的三种评价方法一同进行了比较研究。作者选取了3个复杂程度依次递增的对象系统。最简单的为一4质点简谐链(如图1),特别是当其两端的弹簧拥有较高强度而中间的弹簧较弱时(图1下),从物理直觉得出的粗粒化映射应当是以某种方式将1,2和3,4两组质点分别粗粒化为1个质点。然而,并非所有的评价方法都给出了符合物理直觉的结果。
图1. 不同评价方法在4质点简谐链上的比较。上下两图表分别对应弹簧强度不同的两种情况,不同颜色的柱状图为不同评价方法对某一映射的评分,星标表示该映射为某一评价方法选出的最佳映射。
第二个系统为一仅保留ɑ碳原子的40残基长的蛋白质分子(如图2)。为进行解析计算,作者为该分子构建了一个高斯网络模型(Gaussian network model)。对该系统,作者穷举了在不同分辨率下所有可能的一类映射,即每个等效原子均仅为某一个原子的映射,并用不同的评价方法选取了最佳映射。由于该系统的原子数量较多,基于重构误差的方法无法参与穷举比较。通过用各个最佳映射对应的粗粒化坐标进行时间滞后独立成分分析(Time-lagged Independent Component Analysis (TICA)),我们可以比较不同映射对长时间尺度动力学特征的保留程度。如图3C所示,基于VAMP Score选出的最佳映射在这方面有着最好的表现。
第三个系统最为贴近真实,为一仅保留ɑ碳原子的13残基长的肽链(如图3)。但对于该系统,作者使用了分子动力学中普遍使用的包含化学键以及非键相互作用的力场,并对该系统进行了长时间尺度的模拟。也因此,对于该系统,必须通过数值近似的方法计算各评价方法的评分。由于映射熵目前尚无可靠的数值近似方法,故不在此系统中参与比较。作者对其余方法在特定分辨率上,采取与上一个系统相同的方式进行了比较。基于VAMP Score选出的最佳映射再一次在对长时间尺度动力学特征的保留程度上有着最好的表现(图3下)。
图2.不同评价方法在高斯网络模型上的比较。A)不同评价方法在不同分辨率下选取的最佳映射。B)基于振动能力和VAMP Score的评价方法在4等效原子分辨率下对所有映射的评分,红、绿、蓝三色分别代表三种方法选取的最佳映射;菱形标志代表将该分子均分为4份后各自取质心的映射。C)不同最佳映射基于TICA得到的动力学模式时间标度及其与全原子模型的对比。
图3.不同评价方法在肽链模型上的比较。上图,基于振动能力和VAMP Score的评价方法在4等效原子分辨率下对所有映射的评分,红、紫、蓝三色分别代表三种方法选取的最佳映射;下图,不同最佳映射基于TICA得到的动力学模式的时间标度及其与全原子模型的对比。
总结与展望
本文首次提出了与保留长时间尺度动力学特征直接关联的粗粒化映射评价方法。该方法未来有望针对不同生物大分子,生成其相应的通用粗粒化映射。配合数据驱动的粗粒化力场标定算法,可以实现粗粒化模型完整的自动化数据驱动构建,为高效模拟生物大分子在大空间尺度和长时间尺度上的现象和行为提供有力的工具。
通讯作者信息
Cecilia Clementi,柏林自由大学教授,长期从事对于生物物理系统分子学动力模拟的方法学研究。
扫描二维码免费下载全文
ACS Cent. Sci. 2023, 9, 2, 186–196
Publication Date: January 17, 2023
https://doi.org/10.1021/acscentsci.2c01200
Copyright © 2023 The Authors. Published by American Chemical Society
ACS Central Science是ACS最具包容性的交叉学科期刊,发表以化学为中心的多学科领域最前沿,最重要的研究成果。旨在为全球学者提供交流平台,文章即时发表,全球免费获取,作者也无需付费。
点击“阅读原文”
你“在看”我吗?