Nature Medicine | 谷歌团队开发一款个人健康大型语言模型：个性化AI健康教练

星标“医工学人”，第一时间获取医工交叉领域新闻动态~

备用标题模板

随着穿戴式设备的普及，人们能够持续监测睡眠、身体活动和心率等健康数据。然而，这些数据往往是零散、缺乏情境的，普通用户甚至临床医生都很难解读并从中获得个性化、可执行的健康建议。但现在，Google的研究人员给出了新的答案：一个专为您打造的AI健康教练。8月14日发表在《Nature Medicine》的文章中，Google研究中心团队开发了一款名为“个人健康大型语言模型”（PH-LLM）的AI。

超越专家：AI在专业知识上的惊人表现

这个模型基于Google强大的Gemini架构进行了精细的专业化训练，其目标不仅是理解语言，更是要读懂您身体的“语言”——那些来自穿戴式设备的每日健康数据。

图1：PH-LLM的原理图和性能，PH-LLM从个人健康的三个方面进行了评估。

研究结果令人震惊。在一场模拟专业认证的考试中，PH-LLM的表现不仅轻松达标，甚至超越了一组经验丰富的人类专家。在睡眠医学知识测试中，PH-LLM的准确率达到79%，而人类专家为76%。在更具挑战性的健身教练认证考试中，它的得分更是高达88%，将人类专家的71%远远甩在身后。

表1：PH-LLM在模拟专业认证考试中的表现

表2：睡眠专业考试按题目难度分层的性能比较

真实个人健康案例检验：AI教练的实战能力

“这不仅仅是让AI背诵医学教科书，”该研究的共同作者在论文中指出，“我们真正想知道的是，它能否像一位真正的教练那样，看着你的数据，并告诉你该怎么做。”

为此，团队进行了一项更贴近真实世界的评估。他们创建了超过850份详细的个人健康案例，每一份都包含长达一个月的真实穿戴设备数据。在健身方面，PH-LLM的建议质量与人类专家不分伯仲。而在睡眠领域，经过微调的PH-LLM在提供个性化洞察和分析睡眠问题潜在原因方面，显著优于未受专门训练的通用大模型，它能够像专家一样，从数据中发现规律，并给出“保持卧室阴凉黑暗、避免小睡”等具体建议。

图2：PH-LLM在个性化指导生成的案例研究评估和表现。

关键突破：让AI读懂你的主观感受

这项研究最巧妙的创新之一，是让AI学会了理解“感受”。我们都知道，睡眠数据好不代表你“感觉”睡得好。PH-LLM通过一个特殊的多模态适配器，学会了从客观的传感器数据中预测用户的主观睡眠质量报告。这意味着，未来的AI教练不仅能看到你的数据，还能推断你的感受，从而提供更具同理心和真正个性化的指导。