星标“医工学人”,第一时间获取医工交叉领域新闻动态~

随着穿戴式设备的普及,人们能够持续监测睡眠、身体活动和心率等健康数据。然而,这些数据往往是零散、缺乏情境的,普通用户甚至临床医生都很难解读并从中获得个性化、可执行的健康建议。但现在,Google的研究人员给出了新的答案:一个专为您打造的AI健康教练。8月14日发表在《Nature Medicine》的文章中,Google研究中心团队开发了一款名为“个人健康大型语言模型”(PH-LLM)的AI。

这个模型基于Google强大的Gemini架构进行了精细的专业化训练,其目标不仅是理解语言,更是要读懂您身体的“语言”——那些来自穿戴式设备的每日健康数据。

图1:PH-LLM的原理图和性能,PH-LLM从个人健康的三个方面进行了评估。
研究结果令人震惊。在一场模拟专业认证的考试中,PH-LLM的表现不仅轻松达标,甚至超越了一组经验丰富的人类专家。在睡眠医学知识测试中,PH-LLM的准确率达到79%,而人类专家为76%。在更具挑战性的健身教练认证考试中,它的得分更是高达88%,将人类专家的71%远远甩在身后。
表1:PH-LLM在模拟专业认证考试中的表现

表2:睡眠专业考试按题目难度分层的性能比较

“这不仅仅是让AI背诵医学教科书,”该研究的共同作者在论文中指出,“我们真正想知道的是,它能否像一位真正的教练那样,看着你的数据,并告诉你该怎么做。”
为此,团队进行了一项更贴近真实世界的评估。他们创建了超过850份详细的个人健康案例,每一份都包含长达一个月的真实穿戴设备数据。在健身方面,PH-LLM的建议质量与人类专家不分伯仲。而在睡眠领域,经过微调的PH-LLM在提供个性化洞察和分析睡眠问题潜在原因方面,显著优于未受专门训练的通用大模型,它能够像专家一样,从数据中发现规律,并给出“保持卧室阴凉黑暗、避免小睡”等具体建议。

图2:PH-LLM在个性化指导生成的案例研究评估和表现。
这项研究最巧妙的创新之一,是让AI学会了理解“感受”。我们都知道,睡眠数据好不代表你“感觉”睡得好。PH-LLM通过一个特殊的多模态适配器,学会了从客观的传感器数据中预测用户的主观睡眠质量报告。这意味着,未来的AI教练不仅能看到你的数据,还能推断你的感受,从而提供更具同理心和真正个性化的指导。

图3:PH-LLM使用传感器数据预测主观睡眠质量报告结果(PRO)的能力。
当然,这项技术并非完美无瑕。研究人员承认,模型偶尔还是会“捏造”事实或错误引用数据,这在医疗健康领域是需要警惕的红线。此外,训练数据的代表性问题,也意味着模型对某些人群的适用性还有待验证。
尽管如此,PH-LLM的出现标志着一个重要的转折点。它证明了大型语言模型有潜力将穿戴式设备从一个单纯的数据记录器,转变为一个能动的、智能的个人健康伙伴。由PH-LLM引领的个性化健康革命,或许才刚刚拉开序幕。
[1] Khasentino, J., Belyaeva, A., Liu, X., et al. (2025). A personal health large language model for sleep and fitness coaching. Nature Medicine.
https://doi.org/10.1038/s41591-025-03888-0.
END
编辑 | 郝娅婷
排版 | 张艳青
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,
参与线上线下交流活动

推荐阅读
点击关注医工学人

本篇文章来源于微信公众号: 医工学人