用于预测单倍型移植后难治/复发巨细胞病毒感染的机器学习模型

【一分钟秒懂要点】

1、巨细胞病毒(CMV)感染是单倍型移植(HID HSCT)后最常见的感染事件。即使接受了抗病毒治疗,相当一部分患者会表现为难治/复发CMV 感染。前期研究发现了一系列与难治性CMV 感染有关的危险因素,但是目前还没有综合性的模型来预测HID HSCT 后的难治/复发CMV 感染。

2、基于机器学习的方法,本研究建立了一个用于预测单倍型移植后难治/复发CMV感染的模型。

3、建立的模型如下:Y=0.0322×(年龄)-0.0696×(性别)+0.5492×(原发病)+0.0963×(植入前泼尼松的累积剂量)-0.0771×(移植物中的CD34+细胞数)-1.2926。根据阈值(0.5243)将患者分成高风险组和低风险组。在低风险组和高风险组中,难治/复发CMV感染的100天累积发生率分别为42.0% [95%置信区间(CI),34.7%-49.4%]和63.7%(95%CI,54.8%-72.6%)(P<0.001)。

4、本文以Article形式发表于Frontiers in Cellular and Infection Microbiology杂志。

通讯作者

莫晓冬 副主任医师

医学博士,副教授,副主任医师,硕士研究生导师

国家血液系统疾病临床医学研究中心

北京大学血液病研究所

北京大学人民医院血液科

北京市青年拔尖人才,北京市高层次创新创业人才。主持/参与多项国家级、省部级科研项目,以第一作者/通讯发表SCI论文48篇,以主要完成人身份获得国家科学技术进步奖二等奖、中华医学科技奖一等奖、教育部科学技术进步一等奖、华夏医学科技奖一等奖、广东省科技进步一等奖

现任中国老年血液综合评估委员会委员;中国医药教育协会转化医学专业委员会委员;北京癌症防治学会造血干细胞移植专业委员会委员;北京抗癌协会科普专业委员会委员

共同第一作者

沈梦竹 硕士研究生

国家血液系统疾病临床医学研究中心

北京大学人民医院

北京大学血液病研究所

2020级科研型硕士研究生

导师:莫晓冬

共同第一作者

洪申达 助理研究员

北京大学健康医疗大数据国家研究院,博雅博士后、助理研究员

于北京大学智能科学与技术专业获得理学博士学位,曾于美国佐治亚理工学院、哈佛医学院进行博士后研究

研究方向为健康医疗大数据挖掘,时序数据机器学习算法

主持(获批)国家自然科学基金青年科学基金项目1项 第一/通讯作者发表论文17篇

获得中国"互联网+"大学生创新创业大赛全国金奖(2/6),First Place of the PhysioNet/Computing in Cardiology Challenge(1/7),中国计算机学会全国青年大数据创新大赛一等奖(1/3)

共同第一作者

王洁 主治医师

主治医师,医学硕士

山东第一医科大学第二附属医院

研究方向:造血干细胞移植

背景

异基因造血干细胞移植(allo-HSCT)是急性白血病最重要的根治手段,而单倍型供者(HID)是目前最重要的替代供者来源。感染是单倍型移植(HID-HSCT)后常见并发症,也是移植相关死亡的最主要原因。巨细胞病毒(CMV)感染是HID HSCT 后最常见的感染事件,其中在接受以抗胸腺细胞球蛋白(ATG)为基础预处理方案的患者中,CMV 的感染率约为60-70%。虽然目前已经有多种抗病毒治疗药物(例如更昔洛韦、膦甲酸钠),但即使接受了抗病毒治疗,仍分别有50.6%和30.3%的患者表现为难治和复发性CMV 感染,而难治/复发CMV 感染是移植后非复发死亡(NRM)的独立风险因素。

前期研究发现了一系列与难治性CMV 感染有关的危险因素,例如年龄、使用ATG、以及长期使用抗 CMV 药物等。由于大多数 CMV 感染发生在 HID HSCT 植入后的早期阶段,我们推测植入前的变量(例如,植入前糖皮质激素的暴露)也可能与移植后难治性CMV 感染相关。然而,目前还没有综合模型用于预测HID HSCT 后的难治/复发CMV 感染。研发一种包含患者、移植相关特征、植入前因素等多种危险因素的综合性预测模型用于预测HID HSCT 后难治/复发CMV 感染的发生具有十分重要的临床意义。

结果

本研究共纳入289例接受HID HSCT的急性白血病患者,其中随机选择60%的患者(n = 170)作为训练队列,其余40%的患者组成验证队列(n = 119)(图1)。

使用训练队列建立机器学习模型:

Y=0.0322×(年龄)-0.0696×(性别)+0.5492×(原发病)+0.0963×(植入前泼尼松的累积剂量)-0.0771×(移植物中的CD34+细胞数)-1.2926。发生率的阈值为0.5243,g-mean 为0.635。

其中变量赋值如下:年龄,取具体数值(岁,取整数);植入前激素累积剂量,等量换算成泼尼松,取具体数值(mg/kg);移植物CD34+细胞绝对值,取具体数值(×106/kg);原发病,急性髓系白血病赋值为0,急性淋巴细胞白血病赋值为1;性别赋值,男性赋值为0,女性赋值为1。

根据阈值将患者分为高危组和低危组:发生率大于阈值判断为高危,其余判断为低危。

在建模队列中,模型的敏感度、特异度、ROC 曲线下面积和准确率分别是 0.531、0.742、0.654 以及0.641。在验证队列中,模型的敏感度、特异度、ROC曲线下面积和准确率分别是0.446、 0.667、0.586 以及0.546(图2)。

在总队列中,低危组和高危组 100 天的难治和/或复发 CMV 感染的累积发生率分别为42.0% (95%CI,34.7%–49.4%)和63.7% (95%CI, 54.8%–72.6%)(P< 0.001)。低危组和高危组100 天的总CMV 感染的累积发生率分别为74.4%(95%CI,67.9%–80.9%)和88.5%(95%CI,82.6%–94.4%)(P= 0.004)(图3)。

此外,在合并和不合并急性GVHD的患者中,该模型同样可以预测难治/复发CMV感染的发生(图4)。

对于移植后1年的临床预后,该模型预测为低危的患者,1年累积复发率、NRM、无病生存和总生存均显著优于预测为高危的患者(图5)。

结论:

基于机器学习的方法,本研究建立的模型可以预测HID HSCT后难治/复发CMV感染,并且此模型简单易操作,容易推广,有助指导HID HSCT后难治/复发CMV感染的分层预防。

原文链接:

Shen MZ, Hong SD, Wang J, Zhang XH, Xu LP, Wang Y, Yan CH, Chen H, Chen YH, Han W, Wang FR, Wang JZ, Liu KY, Huang XJ, Mo XD. A Predicted Model for Refractory/Recurrent Cytomegalovirus Infection in Acute Leukemia Patients After Haploidentical Hematopoietic Stem Cell Transplantation. Front Cell Infect Microbiol. 2022 Mar 22;12:862526. doi: 10.3389/fcimb.2022.862526. PMID: 35392613; PMCID: PMC8981086.

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章