AI 正在把运动变成“可计算的人体系统”

星标“医工学人”，第一时间获取医工交叉领域新闻动态~

最近读到一篇发表在 Nutrients 的综述论文，题目是 Artificial Intelligence in Endurance Sports: Metabolic, Recovery, and Nutritional Perspectives。这篇文章讨论 AI 在耐力运动中的应用，包括代谢健康、恢复监测、营养个性化、补给策略、配速优化，以及数据质量、算法透明度和伦理问题。

如果只把它理解成“AI 如何帮助运动员提升成绩”，我觉得有些低估了这篇论文的意义。

这篇文章真正有意思的地方在于，它并没有把 AI 当成一个单点工具，而是把耐力运动放在一个更大的系统里看：训练、恢复、血糖、营养、睡眠、环境、心理状态和行为数据，开始被放进同一个模型中。论文反复提到的关键词不是某一个传感器，也不是某一个算法，而是多模态数据整合。

这意味着，运动正在从“经验驱动的训练问题”，变成“多模态、动态、可计算的人体系统问题”。

过去的运动科技更多是在记录人体。心率、配速、功率、睡眠、训练负荷，这些数据帮助我们看见身体的一部分。后来，可穿戴设备开始给出恢复分数、压力水平、训练建议。但论文所描述的 AI 趋势，已经不只是记录和展示，而是进入判断和决策：用 HRV、训练负荷、睡眠、饮食和主观感受预测第二天恢复；用CGM和运动强度指导补给；用坡度、风速、功率和生理约束优化配速。

这背后的范式变化，是从 measurement走向decision。

我觉得这是理解 AI coach 的关键。AI coach 如果只是生成一张训练计划，价值是有限的。真正的变化，是它开始把分散的身体信号、运动科学知识和行为反馈，整合成一个持续更新的人体决策系统。

论文中有一个例子很能说明这一点：一项针对 43 名耐力运动员、持续12 周的研究，用 HRV、训练、睡眠、饮食和主观健康数据来预测第二天的恢复状态和 HRV 变化。这个案例重要的不是模型本身多先进，而是它说明恢复不再被看作一个单一指标问题。恢复是训练刺激、睡眠、营养、心理状态和自主神经系统共同作用后的结果。

这和我过去做运动康复时的体会非常接近。

康复师看肌肉、骨骼、关节活动度和发力模式；运动生理师看心肺、代谢、乳酸和恢复；营养师看能量供给；主教练看周期和比赛目标。每个人都在看人体的一部分，而且每个人都可能是对的。真正的问题不是缺少专业知识，而是这些专业判断很难被实时整合。

所以，AI coach 真正模拟的不是一个教练，而是一个教练组。

一个运动员的真实状态不会按专业分工切开。肌肉疲劳、糖原消耗、睡眠不足、心理压力、动作代偿和疼痛恐惧，经常在同一个人身上同时发生。论文里讨论的 AI 恢复预测、营养个性化、疲劳识别和配速策略，本质上都在尝试把这些割裂的判断重新放进一个连续系统里。

耐力运动为什么会成为这个趋势的早期场景？论文给出的答案其实很清楚：耐力运动天然会产生大量连续数据，也天然依赖复杂的生理调节。马拉松、骑行、铁三、越野，看似是速度和耐力的竞争，本质上是代谢、热管理、补给、恢复、神经疲劳和心理状态的协同。

一个运动员“撞墙”，很少是某一个指标单独出了问题，而是糖原、血糖、配速、温度、补水、胃肠反应和神经疲劳共同失衡。一个人今天状态不好，也未必只是睡少了，可能是前几天训练负荷、压力、营养和环境应激叠加出来的结果。

论文提到 CGM 在耐力运动中的应用，我觉得这部分很有代表性。连续血糖监测让运动员可以看到运动过程中血糖变化，AI 再结合运动强度、历史摄入和个人反应，去辅助碳水补给策略。但论文也提醒，CGM存在生理延迟和设备误差，因此不能把血糖曲线机械地等同于即时能量状态。

这个提醒非常重要。

AI 进入运动，并不意味着我们可以简单相信更多数据。恰恰相反，越是数据丰富，越需要理解每一种数据的边界。CGM很有价值，但它有延迟；HRV 很有价值，但它不能单独解释疲劳；PPG很有价值，但它不是万能入口；IMU 可以帮助识别动作和疲劳，但佩戴位置、场景和模型训练方式都会影响结果。

所以，真正成熟的 AI 运动系统，不是把所有数据都变成一个确定答案，而是能处理不确定性。

这也是我对当前可穿戴行业比较警惕的地方。

PPG是现阶段可穿戴设备非常重要的基础技术。它让连续心率、脉搏波、HRV等信号能够低成本、低负担地长期采集。没有PPG，今天很多运动可穿戴产品都不可能成立。

但任何传感器都有能力边界。

PPG可以很好地参与心率趋势、压力和恢复等状态判断。但像最大摄氧量、睡眠分期这类复杂指标，涉及更复杂的生理机制和测量条件。如果只依赖 PPG 相关信号去估算，就必须明确它是估算，说明适用场景和误差边界。很多产品的问题，把估算包装成确定性测量。

论文在伦理和方法部分也反复强调类似问题：AI 应用仍然面临传感器误差、数据噪声、缺失值、标签错误、模型泛化不足、算法黑箱和外部验证不足。这说明 AI 不会自动让运动科学更严谨。如果底层数据和模型边界不清楚，AI 反而会让“伪精确”看起来更智能。

论文还提到一个很关键的限制：很多模型的训练数据不够多样，往往偏向年轻、男性、精英或西方运动员，导致模型在不同性别、年龄、运动水平和人群中的泛化能力不足。

这其实触及了AI 运动产品的一个根本问题：人体不是线性的，也不是同质的。

同样的训练负荷，对不同人可能是完全不同的刺激。同样的HRV变化，在不同人身上可能代表疲劳，也可能是适应过程中的正常波动。同样睡了 8 小时，有人恢复很好，有人仍然处在高压力状态。单一指标可以提示风险，但不能独立完成判断。

这也是论文强调多模态融合的原因。

恢复不应该只看 HRV，还要看睡眠、训练负荷、主观疲劳、近期饮食、环境压力和运动表现。补给不应该只看血糖，还要结合运动强度、历史摄入、胃肠反应、天气和比赛策略。训练建议不应该只看当天的 readiness score，还要理解长期适应曲线。

不过，即便模型更准确，也不意味着 AI coach 一定有效。

这里需要补进一个这篇 AI 耐力运动综述没有充分展开、但在真实产品里非常关键的问题：行为转化。

一篇关于身体活动行为的评论文章提供了很好的补充视角。它指出，过去几十年，公共健康领域一直在告诉人们“应该运动多少”“为什么运动有益”，但身体活动水平并没有因此显著改善。原因在于，人的运动行为并不只由理性认知驱动，长期坚持更依赖即时体验、愉悦感、自主性和短期反馈。

这对AI coach 很重要。

用户不会因为收到一个理论上更优的计划，就自动执行。我以前做康复时曾经以为，用户不执行方案是因为不自律。后来自己经历腰椎间盘突出，才意识到疼痛、恐惧和不确定感会极大影响一个人的行动能力。

一个处在疼痛或疲惫中的人，需要的不只是“最优方案”，而是安全边界、短期目标、即时反馈和确定性预期。

所以真正好的 AI coach，不仅要理解生理，还要理解行为。它必须把生理判断翻译成用户当下能完成的行动：今天练什么，练到什么程度，什么情况该停，多久可以进阶，异常反应如何处理。

这决定了 AI coach 和 dashboard 的区别。

dashboard 告诉你发生了什么。

AI coach 应该告诉你下一步怎么做，并且让这一步真的能被完成。

从这个角度看，AI coach 的核心能力不只是推荐训练计划，而是把运动科学、生理状态和行为心理学整合起来。它既要知道什么是科学上正确的，也要知道什么是这个人今天愿意做、敢做、能够坚持做的。

这个提醒非常重要。

所以，真正成熟的 AI 运动系统，不是把所有数据都变成一个确定答案，而是能处理不确定性。

这也是我对当前可穿戴行业比较警惕的地方。

但任何传感器都有能力边界。

这其实触及了AI 运动产品的一个根本问题：人体不是线性的，也不是同质的。

这也是论文强调多模态融合的原因。

不过，即便模型更准确，也不意味着 AI coach 一定有效。

这里需要补进一个这篇 AI 耐力运动综述没有充分展开、但在真实产品里非常关键的问题：行为转化。

这对AI coach 很重要。

一个处在疼痛或疲惫中的人，需要的不只是“最优方案”，而是安全边界、短期目标、即时反馈和确定性预期。

这决定了 AI coach 和 dashboard 的区别。

dashboard 告诉你发生了什么。

AI coach 应该告诉你下一步怎么做，并且让这一步真的能被完成。

▼参考资料

Grivas, G.V.; Safari, K. Artificial Intelligence in Endurance Sports: Metabolic, Recovery, and Nutritional Perspectives. Nutrients 2025, 17, 3209. https://doi.org/10.3390/nu17203209

END

撰文 | 刘瑄伦

编辑 | 余帆

审核 | 医工学人理事会

扫码加入医工学人，进入综合及细分领域群聊，参与线上线下交流活动

发表回复 取消回复

发表回复取消回复