基于机器学习的急性缺血性脑卒中医院感染预测模型建立与评价

刘建模,罗颢文,俞鹏飞,吴一帆,韩梦琦,贾伟杰,易应萍

(1.南昌大学第二附属医院科技处,江西 南昌 330000;
2.南昌大学公共卫生学院,江西 南昌 330000)

脑卒中是一种因大脑血液循环障碍而导致脑功能障碍的疾病,以高发病率、高致残率、高病死率、高复发率、高经济负担为共同临床特征[1]。脑卒中是成人致残、致死首位原因,年死亡人数约为150万,致残率约为75%[2-5]。目前,急性缺血性脑卒中患者医院感染已成为全球关注的公共卫生问题,其不仅会增加患者致残率、致死率,影响患者的预后,还会增加患者家庭以及社会的经济负担[6]。近年来,随着信息科技化的不断发展,国内外学者致力于利用机器学习算法辅助医疗诊断与疾病预测[7-11]。医院感染作为急性缺血性脑卒中常见并发症,其严重影响了患者的预后,早预测、早干预对改善患者预后意义重大[12]。本研究采用机器学习算法建立急性缺血性脑卒中患者医院感染预测模型,有效预测缺血性脑卒中患者发生医院感染情况,为临床决策提供数据支持。

1.1 研究对象 选取2020年10月—2021年12月江西省某三甲医院神经内科收治的2 360例缺血性脑卒中患者。其中男性患者1 494例,女性患者866例,年龄18~100岁,平均(61.7±20.5)岁。纳入标准:经CT、MRI诊断为急性缺血性脑卒中,住院时长>48 h;
排除标准:年龄<18岁,入院48 h内存在肺部感染、尿路感染、消化道感染等其他感染,合并肝、肾功能不全或者其他严重的系统性疾病,合并肿瘤,临床资料缺失者。

1.2 观测指标 所有资料来自江西省医疗大数据工程技术研究中心,且检验、检查数据均为患者入院48 h以内,具体指标如下:(1)人口统计学信息,性别、年龄;
(2)疾病相关因素,意识障碍、吞咽困难、入院NIHSS评分、侵入性操作;
(3)合并症,高血压、糖尿病、高脂血症、冠状动脉疾病、房颤;
(4)既往史,糖尿病史、高血压史、脑血管病史、慢性阻塞性肺疾病(COPD)史;
(5)个人史,吸烟、饮酒;
(6)检验指标,血小板计数、糖化血红蛋白、血白细胞、血前白细胞、血中性粒细胞、血红细胞分布宽度、血清脂蛋白a、血清钠、血清钾等指标。

1.3 诊断标准 参照中华人民共和国卫生部2001年颁布的《医院感染诊断标准(试行)》进行诊断[13]。

2.1 急性缺血性脑卒中患者医院感染情况 2 360例急性缺血性脑卒中患者发生医院感染574例,医院感染发生率为24.32%。其中肺部感染396例,感染率为16.78%;
呼吸道感染64例,感染率为2.71%;
泌尿感染77例,感染率为3.26%;
胃肠道感染27例,感染率为1.14%;
其他感染(口腔、皮肤等)共33例,感染率为1.40%;
两个部位感染共23例,感染率为0.97%。

2.2 医院感染危险单因素分析 将患者以入院48 h后是否发生感染分为感染组与未感染组,单因素分析结果显示:脑血管病史、慢性阻塞性肺疾病(COPD)史、房颤、高脂血症、吸烟、饮酒、侵入性操作、意识障碍、吞咽困难、电解质紊乱、血清钠、血前白蛋白、血清蛋白、血总蛋白、血白细胞、血中性粒细胞、血红细胞分布宽度、血葡萄糖、入院NIHSS评分、年龄两组比较,差异均存在统计学意义(均P<0.05)。见表1。

表1 急性缺血性脑卒中患者医院感染组与未感染组患者基线资料

2.3 基于logistic多因素医院感染危险因素分析 将上述单因素分析筛选出具有统计学意义的变量作为自变量纳入到多因素logistic回归分析模型中,以入院48 h后是否发生医院感染作为因变量,其中年龄(赋值:≤65岁=0,>65=1)、入院NIHSS评分(赋值:≤5=0,>5=1)、血白细胞(赋值:≤10=0,>10=1)、血清钠(赋值:>135=0,≤135=1),logistic回归分析显示,年龄>65岁、入院NIHSS评分>5分、血清钠≤135 mmol/L、血白细胞>10×109/L)、侵入性操作、吞咽困难均为急性缺血性脑卒中患者发生感染的独立危险因素(均P<0.05),见表2。

表2 脑卒中医院感染多因素logistics回归分析

2.4 logistic回归与机器学习预测模型比较分析 将单因素分析筛选出具有统计学意义的变量纳入至模型中,分别建立基于logistic回归、RandomForest、XGBoost、LightGBM的医院感染预测模型。计算模型的灵敏度、特异度以及AUC。结果显示,logistics回归、RandomForest、XGBoost、LightGBM模型预测阈值分别为0.137、0.117、0.114、0.129。在测试集集中,logistics回归、RandomForest、XGBoost、LightGBM模型预测医院感染的AUC值分别是0.854、0.850、0.881、0.870。LightGBM算法特异度最高;
XGBoost模型AUC值、准确性、灵敏度均为最高。XGBoost的整体的预测效果优于其他三种模型,见表3和图1。校准曲线显示,4种机器学习模型均表现出良好的校准度,预测概率与实际概率之间没有明显的偏差。其中XGBboost与LightGBM模型具有较高的区分度,见图2。

表3 4种算法模型在测试集中预测效果比较

图1 4种算法模型的预测性能比较

图2 4种算法模型的校准曲线

2.5 基于SHAP解释模型的医院感染影响因子分析 SHAP是由Shapley value启发的可加性解释模型。通过shap.summary_plot方法对特征进行整体的可视化。如图3所示,模型前8贡献特征,每一行代表一个特征,横坐标为SHAP值。一个点代表一个样本,颜色越红说明特征本身数值越大,颜色越蓝说明特征本身数值越小。基于SHAP解释XGBoost模型的医院感染影响因子可以直观地看到年龄越大、血白细胞值越高、入院NIHSS评分越高、侵入性操作、意识障碍以及吞咽困难与医院感染呈正相关。血总蛋白、血清钠与医院感染呈负相关。

图3 XGBoost模型影响因子

对每个预测样本,模型都产生一个预测值,SHAP值就是该样本中每个特征所分配到的数值。如图4所示:患者A的SHAP值为-2.02,小于模型预测基础值,模型预测该患者不会出现医院感染。患者A入院NIHSS评分<5分、未出现侵入性操作、血总蛋白为68.14 g/L、血白细胞<10×109/L及意识障碍为蓝色,象征着这些特征将患者A的SHAP值拉低,对结果起负向作用。此外,年龄>65岁为红条,象征着其对医院感染起正向作用。如图5所示:患者B的SHAP值为-0.10,大于模型预测基础值,模型预测该患者会发生医院感染。患者B未出现侵入性操作以及血白细胞<10×109/L为蓝色,起保护作用,年龄>65岁、血总蛋白为71.17 g/L、入院NIHSS评分>5分及吞咽困难为红色,这些因素对患者B发生医院感染起正向作用,且吞咽困难最宽,影响作用最大,应注意防范,防止发生医院感染。

图4 患者A模型评估

图5 患者B模型评估

医院感染是急性缺血性脑卒中患者主要的并发症,其不仅延长住院时间,增加治疗费用,而且可以导致病情加重和病死率升高[14]。据统计,急性缺血性脑卒中患者医院感染发生率约为20%,主要有肺部感染、呼吸道感染、泌尿感染、胃肠道感染等[15]。本组2 360例急性缺血性脑卒中患者中574例发生医院感染,感染发生率为24.3%,与以往的研究[16]结果基本一致。

本研究采用logistic回归以及RandomForest、XGBoost、LightGBM三种机器学习算法将单因素筛选的20个具有统计学差异的特征纳入模型,构建急性缺血性脑卒中患者医院感染预测模型,结果显示,在测试集中logistics回归、RandomForest、XGBoost、LightGBM模型预测医院感染的AUC值分别是0.854、0.850、0.881、0.870。XGBoost准确性、灵敏度、AUC值均最高为0.858、0.730、0.881。LightGBM回归特异度最高为0.905。XGBoost整体的预测效果优于其他三种模型,可为前瞻性研究提供相应支持。在后续研究中可开发应用于临床的预测软件,早期预测缺血性脑卒中患者医院感染。

基于XGBoost算法的急性缺血性脑卒中医院感染预测模型SHAP特征解释:年龄越大、血白细胞值越高、入院NIHSS评分越高、侵入性操作、意识障碍、吞咽困难、血总蛋白越低、血清钠越低是医院感染的影响因素,与多因素logistic回归分析中差异有统计学意义的变量具有高度的一致性。分析原因主要为:随着年龄的增长,高龄患者出现生理机能下降,抵抗力降低,易发生医院感染,与研究[17]报道一致。患者由于存在意识障碍、吞咽困难等原因易出现呛咳和误吸,且部分患者需要进行侵入性操作,该操作将导致病原体进入体内发生感染[18-19]。入院NIHSS评分越高,患者神经功能损伤越严重,神经功能的损伤会使免疫系统出现抑制,而免疫抑制将会明显增加患者感染的概率[20]。神经功能损伤越严重日常活动能力下降也越严重,吞咽困难以及尿潴留为常见症状,需进行侵入性操作进而导致医院感染[21]。卒中时下丘脑直接或间接受损,一方面引起抗利尿激素分泌异常,导致尿量减少,水潴留,细胞外液扩张,血钠降低,进而引起感染;
同时低血清钠与步态障碍、认知障碍、骨质疏松、跌倒等有关,当患者出现步态障碍、认知障碍、骨质疏松等症状,往往需要对患者进行侵入性操作,该操作将易引起患者出现肺部、尿道等部位的感染[22]。血总蛋白降低,会导致营养不良,免疫状态异常,身体器官可能会有积水,这些都会增加感染的机会[23]。低蛋白血症会导致有效血容量减少,血液浓缩高凝,血栓栓塞的风险增高,低蛋白血症导致严重血容量不足、急性肾静脉血栓、肾间质水肿,这些都可以引起急性肾损伤。相关研究[24]表明,在缺血性脑卒中损伤中,炎症反应发挥着重要的作用。周静等[25]对3 000例缺血性脑卒中患者随访发现,不良预后的发生率提升67%~93%。高列花等[26]研究显示,白细胞计数越高,急性缺血性脑卒中患者住院期间的死亡风险就越高,表明白细胞计数为预测急性缺血性脑卒中患者预后的一个有效因素。本研究发现随着白细胞计数的增加,患者出现医院感染的概率也会随之增加。

综上所述,基于机器学习算法的急性缺血性脑卒中医院感染预测模型能有效地预测患者发生医院感染情况,能够为缺血性脑卒中住院患者医院感染的预防和干预提供一定的参考。患者发生医院感染与其年龄、血白细胞、侵入性操作、入院NIHSS评分、血清钠、血总蛋白、意识障碍、吞咽困难等多种因素相关,需要患者、医护人员、家属都尽力避免一切可能引起感染的因素,尽早干预。但本研究存在一定的局限性:(1)数据仅来自江西一家医疗机构,数据可能会存在一定偏倚。(2)数据样本量不够大,模型的泛化能力还有待验证。

利益冲突:所有作者均声明不存在利益冲突。

猜你喜欢白细胞缺血性入院利用信息技术再造急诊入院管理流程*重庆医学(2022年24期)2023-01-04住院医师入院教育实践与效果探索中国毕业后医学教育(2021年3期)2021-12-02白细胞中国宝玉石(2021年5期)2021-11-18缺血性二尖瓣反流的研究进展心肺血管病杂志(2019年9期)2019-12-09针灸在缺血性视神经病变应用中医眼耳鼻喉杂志(2019年3期)2019-04-13白细胞降到多少应停止放疗人人健康(2017年19期)2017-10-20缺血性脑卒中恢复期的中蒙医康复治疗中国民族医药杂志(2016年5期)2016-05-09白细胞介素17在湿疹发病机制中的作用转化医学电子杂志(2015年4期)2015-12-27内皮祖细胞在缺血性脑卒中诊治中的研究进展医学研究杂志(2015年11期)2015-06-10鸡住白细胞虫病防治体会云南畜牧兽医(2014年2期)2014-02-28

推荐访问:缺血性 模型 感染