医疗科技评论 | 基于光电容积脉搏波的智能睡眠检测:可解释机器学习模型的突破

星标“医工学人”,第一时间获取医工交叉领域新闻动态~

图片
睡眠障碍已成为影响全球数百万人健康的严峻公共卫生问题,不仅降低生活质量,还与多种慢性疾病(如肥胖、糖尿病、心血管疾病和精神健康障碍)的发生发展密切相关。因此,准确、便捷的睡眠-觉醒状态分类对于睡眠障碍的诊断、管理和治疗至关重要。尽管多导睡眠监测(PSG)是临床诊断的“金标准”,但其成本高昂、过程侵入性强、需要在专业实验室进行,并且可能干扰自然睡眠,限制了其在广泛人群和长期监测中的应用。近年来,光电容积脉搏波(PPG)技术因其无创、成本低廉且易于集成到可穿戴设备中的特性,在睡眠监测领域展现出巨大潜力。

近期发表于 npj Biosensing 的一篇题为《用于光电容积脉搏波自动睡眠检测的可解释性基于特征的机器学习》(“Interpretable feature-based machine learning for automatic sleep detection using photoplethysmography”)的研究,为PPG在睡眠监测领域的应用带来了显著进展。该研究利用公开的临床数据集,通过精心的特征工程、先进的机器学习方法以及对关键技术挑战(如类别不平衡)的有效处理,开发出一个可解释性强且性能优越的睡眠-觉醒自动分类模型。

该研究的主要进步与发展
这项研究的核心贡献在于其严谨的方法学、对临床实用性的关注以及对以往研究局限性的克服,主要体现在以下几个方面:

 

01

强调模型的可解释性与临床应用潜力
与许多采用“黑箱”深度学习模型直接处理原始PPG信号的方法不同,本研究选择了基于特征的随机森林(Random Forest)分类器。研究团队从PPG信号及其衍生的心跳间期(PPI)时间序列中提取了多达330个特征,并通过统计检验和SelectFromModel等方法筛选出最具信息量的特征子集。这种方法不仅降低了计算需求,更重要的是,它允许研究人员分析哪些生理特征对于区分睡眠和觉醒状态最为重要,从而增强了模型的可解释性。这对于临床医生理解和信任模型的预测结果至关重要。

《研究流程与结果概览 (改编自原文Fig. 1)》

02

有效解决睡眠数据中的类别不平衡问题

 

在睡眠数据中,睡眠期通常远长于觉醒期,导致严重的类别不平衡,这会使模型倾向于将样本预测为多数类(睡眠),从而导致对少数类(觉醒)的检测能力低下。该研究系统地评估了多种处理类别不平衡的方法,并最终采用了自适应合成抽样技术(ADASYN)。结果显示,在未进行平衡处理时,模型虽然在睡眠检测上灵敏度很高(94.47%),但在觉醒检测上的特异性仅为23.85%。通过ADASYN平衡处理后,觉醒检测的特异性显著提升至71.31%,同时睡眠检测的灵敏度仍保持在88.57%的较高水平,整体F1分数达到81.40%,马修斯相关系数(MCC)也从0.25大幅提升至0.61,表明模型在区分睡眠和觉醒状态方面更加均衡和可靠。

《睡眠-觉醒分类结果:不平衡与ADASYN平衡数据集对比 (改编自原文Fig. 2)》

03

采用公开临床数据集与严格的验证方法

 

研究使用了公开的CAP睡眠数据库(Cyclic Alternating Pattern Sleep Database),包含了84名参与者的PSG和同步采集的PPG数据。使用公开数据集增强了研究结果的可重复性和可比性。更重要的是,研究采用了严格的交叉验证策略,包括5折、10折和20折的组K折交叉验证(GroupKFold CV),确保了来自同一受试者的数据不会同时出现在训练集和测试集中,有效避免了数据泄漏问题,从而使模型性能评估更为客观和泛化能力更强。此外,还进行了留一受试者交叉验证(LOSO CV)来评估模型在不同个体间的表现。

04

深入的特征重要性分析与新特征的探索
通过随机森林模型的特性,研究者能够识别出对睡眠-觉醒分类贡献最大的PPG和PPI特征。分析发现,在不平衡数据集中,PPG信号的偏度(PPG_skew)、25%截尾均值(PPG_TM25)和李雅普诺夫指数(PPG_LC)等形态学和非线性动力学特征较为重要。而在经过ADASYN平衡处理的数据集中,PPI的频域特征(如PPI_LF_HF_power, PPI_VLF_LF_power)的重要性显著提升,这强调了自主神经系统活动在区分睡眠和觉醒中的作用。研究还发现了一些以往研究较少报道或未报道的有效特征,如PPG信号二阶导数的e点和a点比值的均值和标准差(e_a_ratio_mean, e_a_ratio_std),这些新特征的发现为PPG信号的深入分析提供了新视角。
 

《睡眠-觉醒分类中的重要特征排序 (改编自原文Fig. 4)》

 

05

针对不同睡眠障碍亚组的性能评估
研究还评估了模型在不同睡眠障碍亚组(如失眠症、发作性睡病、夜间额叶癫痫、不宁腿综合征、快速眼动期睡眠行为障碍和睡眠呼吸障碍)中的表现。结果显示,模型性能在不同疾病组中存在差异,这反映了不同睡眠障碍对生理信号的独特影响。类别平衡处理同样改善了模型在各亚组中的分类稳健性,尤其是在觉醒检测方面。

临床意义与未来展望
这项研究的成果为开发可靠、便捷且可解释的PPG睡眠监测工具奠定了坚实基础,具有重要的临床转化潜力:
 
  • 推动可穿戴睡眠监测设备的发展: 可解释的、基于特征的模型更易于优化和部署到资源受限的可穿戴设备上,有望实现大规模、长期的家庭睡眠监测,为用户提供个性化的睡眠健康管理。

  • 辅助临床诊断与管理: 准确的睡眠-觉醒分类是评估睡眠质量、诊断睡眠障碍(如失眠、睡眠呼吸暂停)的基础。PPG监测可以作为PSG的有效补充或筛查工具,尤其适用于不便进行PSG检查的人群或需要长期随访的患者。

  • 促进对睡眠生理机制的理解: 通过分析对分类贡献大的生理特征,可以进一步加深对睡眠-觉醒转换过程中自主神经系统、心血管系统变化的理解。

研究者也指出了未来工作的方向,包括进一步优化特征选择方法和噪声处理技术,将模型扩展到多类别睡眠分期(如区分N1, N2, N3, REM期),以及在更大、更多样化的人群(包括更多健康个体)中验证模型的性能,并针对可穿戴设备的实际应用场景(如低采样率、数据丢失)进行模型优化。
 
结论
总而言之,Karmen Markov及其合作者通过这项研究,成功开发并验证了一个基于PPG信号的可解释性机器学习模型,用于自动进行睡眠-觉醒状态的分类。该研究通过严谨的特征工程、对类别不平衡问题的有效解决、以及在公开临床数据集上的严格验证,显著提升了PPG在睡眠监测领域应用的可靠性和临床实用性。这项工作不仅为睡眠医学领域的研究人员和临床医生提供了有价值的工具和见解,也为未来智能可穿戴健康设备的发展开辟了新的道路,有望让高质量的睡眠监测更加普及,从而改善全球数百万睡眠障碍患者的健康福祉。
 

参考资料:

Markov, K., Elgendi, M., Birrer, V. et al. Interpretable feature-based machine learning for automatic sleep detection using photoplethysmography. npj Biosensing 2, 24 (2025). https://doi.org/10.1038/s44328-025-00041-2

END

编译 | 张越青

编辑 | 吴苡齐

审核 | 医工学人理事会

扫码添加医工学人负责人,进入综合及细分领域群聊国内外医工交叉领域顶尖高校、科研院所、医院、企业等专家学者、硕博士、工程师、企业家等,参与线上线下交流活动

图片

 

推荐阅读

 

医工学人公众号征稿须知

 

 

医疗科技评论 | 你的健康设备“安全”吗?从心脏起搏器到智能手环,医疗科技的“隐形危机”与未来之路
 

 

  

医工简报 | DeepSeek 在中国医院系统中的“低成本”采用;一种软体机器人全人工混合动力心脏    

 

医疗科技评论 | 北理工最新Nat. Biomed. Eng | 非侵入性可穿戴设备通过测量脑实质电阻抗谱追踪大脑“排毒”

 

点击关注医工学人

 

本篇文章来源于微信公众号: 医工学人

发表回复