据世界卫生组织数据,全球每年有超过80万人因自杀死亡,抑郁症(Major Depressive Disorder, MDD)是自杀的主要风险因素之一。MDD患者自杀的风险因素通常相互关联且共同作用,传统基于临床症状的访谈无法准确预测患者自杀风险。
南方医科大学尹红蕾和张斌团队采用了一种新的方法,即通过机器学习技术整合患者的多维度信息,包括临床症状、认知功能测试、遗传学信息等,以构建全面的预测模型。
研究发现,整合临床与认知信息的机器学习模型能够准确识别出MDD患者;整合临床、认知信息以及遗传学信息后,模型对于识别有自杀企图的MDD患者(DSA)具有最好的分类性能。研究还通过SHAP(Shapley Additive exPlanations)值来解释模型决策过程,揭示了影响自杀风险预测结果的关键因素。该研究近期发表于Depression and Anxiety(IF 7.4, Q1)。
全球范围内每年有超过80万人死于自杀,给全球心理健康问题带来严峻挑战。抑郁症与自杀行为高度相关。因此,识别抑郁症患者并筛选出高自杀风险患者,采取预防措施,对降低自杀率具有重要意义。传统的自杀风险评估主要依靠临床访谈和心理评估,这两种方法往往依赖医生的主观判断,不仅耗时耗力,还容易受到医生经验和患者隐瞒等影响。
南方医科大学尹红蕾和张斌团队开展了一项前沿的整合性机器学习研究。该研究旨在探索和验证使用机器学习方法预测MDD患者自杀企图的可能性,并评估EPHX2基因在其中的贡献。
该研究采用了一种新的方法,即通过机器学习技术整合患者的多维度信息,包括临床症状、认知功能测试、遗传学信息等,以构建全面的预测模型。团队前期研究发现EPHX2与MDD及自杀行为之间存在潜在的联系,因此该研究特别关注了该基因。
研究过程中,研究团队首先对472名前瞻性收集的参与者进行了详细的临床评估和基因型检测,收集了包括个体的社会人口学数据、详细的临床病史、认知功能测试结果以及遗传信息。研究使用极限梯度提升(XGBoost)分类器来处理这些数据,这是一种提升树模型,将许多树模型集成在一起,形成一个具有强分类性能的模型。
研究比较了不同维度特征组合所构建模型的性能差异。在独立的验证集上,研究发现,整合临床与认知信息的机器学习模型能够准确识别出MDD患者。而在整合了临床、认知信息以及遗传学信息后,模型对于识别有自杀企图的MDD患者(DSA)具有最好的分类性能。这一发现表明,EPHX2基因的特定单核苷酸多态性(SNP)不仅在有无自杀企图的MDD患者间存在差异,还能被应用于提高模型预测自杀风险的准确性。
具体而言,研究发现EPHX2基因中的三个SNP(rs56834178、rs11288636、rs68012435)在自杀风险预测中发挥了重要作用。这些遗传标记的发现不仅为未来的临床干预提供了潜在的靶点,也为精准医学在心理健康领域的应用开辟了新径。
此外,研究还采用了SHAP(Shapley Additive exPlanations)值解释模型的决策过程;这是一种基于博弈论的解释模型方法,可以详细说明每个特征对模型预测结果的贡献大小。通过SHAP值,研究人员不仅能够识别出对模型影响最大的因素,还能够深入了解这些因素是如何影响预测结果的。如模型显示,认知功能的损害、高冲动性和童年期遭受的情感忽视是预测MDD患者的重要因素。
该研究展示了机器学习在精神健康领域的潜力,也为临床医生提供了一个强有力的工具,以更精确地识别出可能存在自杀风险的抑郁症患者。这一成果预示着未来心理健康治疗可能的转变,即从传统的基于症状的治疗方法,向更加个性化和数据驱动的干预策略转变。
文献索引:Zheng S, Zeng W, Wu Q, et al. Predictive Models for Suicide Attempts in Major Depressive Disorder and the Contribution of EPHX2: A Pilot Integrative Machine Learning Study[J]. Depression and Anxiety, 2024, 2024(1): 5538257. https://doi.org/10.1155/2024/5538257
文章转载自公众号-医脉通精神科