星标“医工学人”,第一时间获取医工交叉领域新闻动态~
静息心率(RHR)是心血管健康与全死因死亡率的关键预测指标。然而,要在日常生活中对这一长期趋势进行连续、无创的监测,通常需要用户额外佩戴智能手表或手环,这极大限制了该技术在低收入人群或高龄群体中的普及。
为了打破对传统可穿戴硬件的依赖,谷歌研究团队联合华盛顿大学等顶尖机构,在国际著名学术期刊 Nature 上发表了题为 “Passive heart-rate monitoring during smartphone use in everyday life” 的重磅研究论文。该研究开发了一套名为 PHRM(被动心率监测)的深度学习系统。该系统仅利用智能手机的前置摄像头,即可在用户日常解锁、刷手机等碎片化交互期间,通过面部视频完成高精度、无感且公平的每日静息心率(RHR)和心率(HR)追踪,拉开了普惠级数字化“环境医疗”的序幕。
传统的远端光电容积脉搏波(rPPG)技术在实际应用中十分脆弱,极易受到面部微表情、头部晃动以及环境光线剧烈波动的影响。谷歌团队通过算法重构,实现了在真实、完全不受限的“自由生活”场景下的高抗噪运行。
1. 创新性的多分类概率重构
不同于传统 rPPG 算法直接进行心率数值回归的做法,PHRM 系统将心率估计重构为在 40 到 180 bpm(每分钟搏动次数)这一生物学合理区间内的多类分类任务。
-
优势: 这种概率分布的输出方式允许模型表达自身的不确定性。当输入视频存在剧烈运动(如边走边看手机)时,概率分布曲线会自动变平,从而避免了传统回归模型强制输出错误点估计的弊端。
2.置信度门控过滤机制(Confidence Gating)
在完全不受限的环境中,并不是每一次解锁手机都适合测量。PHRM 系统通过计算心率预测概率分布的负熵作为置信度指标,智能过滤掉诸如面部严重遮挡、环境极度昏暗或面部动作过大的低置信度视频,从源头上确保了入选 RHR 汇总的原始数据质量。
图1 | 本图展示了 PHRM 系统在日常智能手机解锁后的自动化处理流水线:从 8 秒的面部视频片段输入,经历视频保稳、面部裁切、帧差计算,到最终输入时间位移卷积神经网络(TSCNN)。系统自适应判定置信度分数,有效的测量将通过卡尔曼滤波(Kalman Filter)在单日内进行趋势融合,最终输出当日精确的静息心率(RHR)。
3.多维度自由生活数据验证
该系统在 485 名开发参与者和 211 名验证参与者的真实手机使用场景下进行了验证,收集了海量的日常自然交互视频。
图2 | 本图呈现了该研究所使用的数据集所具有的极高现实多样性:包括多样的前置摄像头角度、不同的面部遮挡、以及覆盖了从极暗环境到超过十万勒克斯的强光环境。同时,它展示了来自不同肤色(MST 1-10 范围)参与者的脸颊皮肤样本在多种照度下的真实分布,证明了该数据集对现实生活复杂光影场景的精准捕捉。
为了客观体现 PHRM 的跨时代地位,下表将其与目前的临床、可穿戴和主流实验室级 HSI/rPPG 技术进行了全面横向对比:
|
评估维度 |
临床级心电(ECG) |
消费级智能腕表(接触式PPG) |
常规学术级 HSI / 传统 rPPG |
PHRM 被动监测系统(本研究) |
|
设备依赖性 |
极高(需专用电极、有线绑带) |
高(需额外购买并佩戴手环/手表) |
中(需固定机位、受试者保持静止) |
极低(直接兼容既有智能手机前端) |
|
监测感知度 |
重度侵入/束缚,体验差 |
有无感化的佩戴感,但仍需充电 |
中度侵入,需受试者刻意配合 |
完全无感(背景自动化隐形采集) |
|
多肤色公平性 |
极佳 |
较差(绿色光源在深色皮肤上反射弱) |
极差(对深色皮肤和复杂光照极其敏感) |
极佳(针对不同肤色组实现非劣效性) |
|
日均测量频次 |
极低(仅限体检或住院期间) |
中到高(取决于传感器工作占空比) |
极低(仅限实验室标定) |
极高(随手机解锁、亮屏自动碎片化采集) |
|
RHR 测量重复性 |
较差(单次测量易受白大衣效应干扰) |
较好 |
差 |
极佳(卡尔曼滤波自适应抗噪收敛) |
传统的光电容积脉搏波(PPG)设备(包括指夹式血氧仪和智能手表的绿色光源)因深色皮肤中黑色素对特定光波的吸收,在深色皮肤群体中常出现测量偏差,这一直是全球医疗器械行业面临的伦理与技术红线。
1. 跨肤色群体的非劣效性(Non-inferiority)
研究团队在开发期特意超额招募了深色皮肤(Fitzpatrick Ⅵ 型和 MST 8-10 级别)的受试者进行模型训练与对齐。
图3 | 如图在包含浅肤色、中等肤色、深肤色三类特征人群的外部实验测试中,PHRM 是唯一一个在所有肤色组中均实现平均绝对百分比误差(MAPE)低于 10% 的系统,达到了 ANSI/CTA-2065 国际标准。其在各肤色群体的预测偏差最大值未超过 5%,满足了严苛的临床非劣效性指标,远超目前国际上其他 15 种最先进的学术级 rPPG 算法。
2.高稳定度的日历 RHR 绘制
在自由生活验证(Free-living test)中,系统不仅成功为所有受试者输出了稳定的 RHR 数据,其在长程趋势追踪中还展现出了优于静止临床测试的极高复现性。
图4 | 本图展示了自由生活下 PHRM 预测值与基准设备(Fitbit 智能手环)相比的卓越一致性。随着卡尔曼滤波算法在多日内的自适应收敛,即便是在信号挑战性最高的深肤色组(MST 8-10),其日均 RHR 的平均绝对误差(MAE)也在第三天后迅速收敛至 5 bpm 以下。
同时,广义最小二乘(GLS)统计模型证明,PHRM 导出的 RHR 与已知的健康风险因素高度关联:体重指数(BMI)每上升一个标准差,RHR 独立上升 1.92 bpm;最大摄氧量(VO2 max)每上升一个标准差,RHR 独立下降 1.90 bpm,与传统临床医学规律高度契合。
谷歌团队的这一研究不仅在计算机视觉领域实现了突破,更直接证明了将智能手机摄像头作为“普惠级医疗诊断入口”的可行性,使心血管健康的监控不再是高收入、数字硬件发烧友群体的专属。
然而,在通往完全开放、全天候监测的产业化道路上,该技术依然面临双重挑战:
-
前置判断与功耗优化: 连续在后台调用手机前置摄像头进行 8 秒的视频流录制会带来不容忽视的 CPU 和电池消耗。未来需要进一步结合重力加速度计与手机亮屏状态的前置自适应触发机制——只有在设备平稳、面部完全进入框内、且环境亮度达标时,才静默唤醒摄像头进行捕获,减少无效计算。
-
数据所有权与端侧隐私防线: 面部图像属于高敏感度的个人隐私数据。为了建立受试者和临床医生的双重信任,PHRM 系统未来的落地版本必须将数据链路严格闭环在本地端侧的安全受信执行环境(TEE)中,做到“图像不离端,仅上传加工后的 HR 匿名特征”,彻底封堵数据在传输中泄漏和被仿冒的可能。
[1] Liao, S., Di Achille, P., Wu, J. et al. Passive heart-rate monitoring during smartphone use in everyday life.Nature (2026).
https://doi.org/10.1038/s41586-026-10507-6
END
撰文 | 张越青
排版 | 张艳青
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,
参与线上线下交流活动








