星标“医工学人”,第一时间获取医工交叉领域新闻动态~

在所有健康风险中,心血管疾病以每年近1800万人的致死量位居全球死因首位,占全球死亡率的32%。它不仅威胁着老年群体,更在快节奏生活中向年轻一代蔓延。目前临床诊断与监测的核心依赖于光体积描记(PPG)、心电图(ECG)和动脉血压(BP)等信号,然而现有监测手段存在穿戴设备噪声大、ECG 需贴电极操作复杂、动脉血压监测需有创介入等问题,在日常居家及资源有限的基层医疗机构难以普及。
近期,来自清华大学等的研究团队在 AI 辅助医疗领域取得重要突破,提出一种名为 UniCardio 的多模态扩散 Transformer 框架。该框架通过统一的生成式模型,打破了生理信号间的壁垒,同时实现了信号去噪、缺失补全与跨模态转换三大核心功能。研究基于339小时ICU临床数据验证,在信号生成质量上超越现有基线模型,并在心律失常检测、血压估算等下游任务中表现出与真实信号相当的性能。这一技术突破使得“低成本、高精度、非侵入”的心血管监测成为可能,为推进心血管健康普惠提供了可行方案。

对于一个患有心血管疾病风险的人来说,诊断过程通常涉及繁琐的仪器,如动态心电图或有创血压监测,需要专业医疗资源进行全面监测。这种传统方法虽然数据详尽,却因设备昂贵、佩戴不适且操作具有侵入性而无法满足全天候日常监测的需求。本次研究的突破点在于利用多模态心血管信号开展分析——尽管光体积描记信号 PPG、心电图 ECG 与血压 BP 在物理形态上存在显著差异,但由于其均受同一心血管系统驱动,内在具有高度的生理关联性。因此,UniCardio结合了生成式人工智能技术,通过一个统一的框架捕捉 PPG、ECG 和 BP 之间的复杂映射关系。
UniCardio 的技术优势在于其通用性,而非仅针对去噪或补全等单一任务开发。该框架构建了一个共享的潜在空间,能够处理受环境噪声干扰的穿戴设备 PPG 信号或存在数据缺失的心电记录,并将其重构为高质量的临床级波形。该方法基于对心血管生理规律的深度理解,能够从不完整或低质量的原始数据中还原出准确的健康全景图。
如何能从脉搏光信号(PPG)推算出心脏的电活动(ECG)?又如何在没有袖带的情况下预知血压(BP)波动呢?UniCardio的生成模块具备解决这两个问题的核心能力。首先,模块通过模态特定编码器,利用多尺度卷积神经网络分别提取不同信号在不同时间尺度上的特征,既能捕捉波峰细节,又能提取信号宏观的节律特征。其次,定制化Transformer 模块配合任务特定注意力掩码能够精准控制信息流的走向,聚焦于条件模态(如PPG)与目标模态(如ECG)之间的关联,避免因多模态数据混合而产生的混乱。最后,经过统一的扩散生成过程,模型能够从高斯噪声中逐步还原出高保真的目标生理信号。在PPG转ECG及PPG转BP等任务中,UniCardio 生成的信号在形态和关键特征上与真实信号保持高度一致。
此外,UniCardio有效解决了灾难性遗忘问题。针对多样化的生成任务,研究团队应用了持续学习范式。通过学习率调度和训练批次重组等策略,模型在掌握处理更多模态等新技能的同时保持了对旧知识的记忆,实现了生成效果的稳步提升。在计算效率方面,UniCardio采用 DDIM 采样策略,在保证生成质量的前提下将推理步骤从50步压缩至6步。这使得处理一段 4 秒的信号仅需不到 0.4 秒,满足了实时监测的时效性要求。

图2|模型架构与训练范式。a UniCardio的组成结构,包括模态特异性编码器、配备任务特定注意力掩码的自定义Transformer模块,以及模态特异性解码器。b 生成任务的持续学习范式,该范式通过条件模态数量递增实现,其核心机制包含学习率调度(LRS)、训练批次组合(TBC)和任务特定注意力掩码(TAM)。c-e分别展示了LRS、TBC和TAM的消融研究结果,评估指标采用消融前后的均方根误差比率(数值大于1表示性能下降),量化结果由256次独立试验取平均值,误差条代表均值标准误差。f部分以TBC消融下的PPG-ECG信号转换为例,分阶段可视化了灾难性遗忘现象。
研究团队选取PTB-XL、MIMIC及WESAD 等多个公开数据集对模型进行了全面验证 。在疾病风险预测任务中,UniCardio 将 PPG 信号转换为 ECG 信号,用于检测 ST 段改变这一心肌缺血指标及心肌肥厚等异常 。实验结果表明,该方法在准确率、敏感性和特异性等指标上均接近真实 ECG 信号的诊断水平。

图3|多模态生成任务的综合性能表现。a-c部分展示去噪任务,即从各模态的噪声原始记录中恢复纯净信号;d-f部分为填补任务,从间歇性信号中重建缺失片段(即掩码区域);g-i部分呈现跨模态转换任务,通过一个或多个条件模态合成目标模态信号。为便于可视化,血压(BP)数据展示原始值,而光电容积图(PPG)和心电图(ECG)显示归一化值。量化结果为256次独立试验的平均值,误差条表示均值标准误差。
特别是在房颤检测中,生成的ECG信号显著优于原始PPG信号,有效解决了穿戴设备误报率高的问题。此外,在生命体征监测方面,经微调后的模型能够精准估算收缩压和舒张压,误差显著低于传统基线方法,验证了其在临床辅助诊断中的应用潜力。

图4|典型心电图异常的可视化展示。呈现了一系列显示典型异常的心电信号,以及通过光电容积描记(PPG)到心电图(ECG)转换生成的信号。为便于识别对应异常情况,图中添加了心电图网格线。这些诊断特征进一步通过了临床医师的评估验证。
UniCardio实现了基于统一扩散 Transformer 框架的多模态心血管信号生成,打破了传统单一任务模型的局限,成功在一个模型内集成了信号去噪、缺失补全与跨模态转换三大核心功能 。多维评估与临床验证表明,该框架在处理 PPG、ECG 和 BP 信号时均表现出优异的生成质量与鲁棒性,且推理延迟低至0.4秒,满足实时监测需求。尽管研究团队在模型通用性与临床应用方面取得了显著进展,仍存在一些局限性与未来研究方向:
1.数据覆盖范围的扩展:当前模型预训练所使用的 Cuffless BP 数据集主要来源于 ICU 临床环境,且339小时的数据规模相对有限。对于非临床环境下的日常穿戴数据及特定健康状况的适用性仍需验证。未来将UniCardio应用于更多样化的临床数据集,包括不同年龄、性别、种族以及患有各种心血管疾病的患者群体,以全面评估其在真实世界场景中的性能和泛化能力。
2.增强ECG信号处理能力,深化多模态信号融合:未来的工作将专注于开发更先进的信号处理技术和模型架构,以提高UniCardio对ECG信号的鲁棒性,减少噪声和伪影对生成结果的影响。研究更有效的方法来融合和利用不同心血管信号模态之间的深层关联,例如通过引入更复杂的注意力机制或图神经网络,以更好地捕捉信号间的时空依赖性,从而提高生成信号的质量和生物学合理性。
3.探索实时监测和早期预警:进一步研究UniCardio在实时心血管健康监测和早期疾病预警中的应用潜力,例如通过集成到可穿戴设备中,实现对异常生理状况的持续追踪和及时干预。
Chen, Z., Miao, Y., Wang, L. et al. Versatile cardiovascular signal generation with a unified diffusion transformer. Nat Mach Intell (2025). https://doi.org/10.1038/s42256-025-01147-y
END
撰文 | 姜泽元 姜泽坤
编辑 | 余帆
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,参与线上线下交流活动

推荐阅读
Microsyst. & Nanoeng. | 无电池、无线、无感监测与给药:电子科技大学团队开发一项柔性贴片技术,如何重新定义糖尿病管理?
点击关注医工学人

本篇文章来源于微信公众号: 医工学人









