星标“医工学人”,第一时间获取医工交叉领域新闻动态~
最近读到一篇发表在 Nutrients 的综述论文,题目是 Artificial Intelligence in Endurance Sports: Metabolic, Recovery, and Nutritional Perspectives。这篇文章讨论 AI 在耐力运动中的应用,包括代谢健康、恢复监测、营养个性化、补给策略、配速优化,以及数据质量、算法透明度和伦理问题。
如果只把它理解成“AI 如何帮助运动员提升成绩”,我觉得有些低估了这篇论文的意义。
这篇文章真正有意思的地方在于,它并没有把 AI 当成一个单点工具,而是把耐力运动放在一个更大的系统里看:训练、恢复、血糖、营养、睡眠、环境、心理状态和行为数据,开始被放进同一个模型中。论文反复提到的关键词不是某一个传感器,也不是某一个算法,而是多模态数据整合。
这意味着,运动正在从“经验驱动的训练问题”,变成“多模态、动态、可计算的人体系统问题”。
过去的运动科技更多是在记录人体。心率、配速、功率、睡眠、训练负荷,这些数据帮助我们看见身体的一部分。后来,可穿戴设备开始给出恢复分数、压力水平、训练建议。但论文所描述的 AI 趋势,已经不只是记录和展示,而是进入判断和决策:用 HRV、训练负荷、睡眠、饮食和主观感受预测第二天恢复;用CGM和运动强度指导补给;用坡度、风速、功率和生理约束优化配速。
这背后的范式变化,是从 measurement走向decision。
我觉得这是理解 AI coach 的关键。AI coach 如果只是生成一张训练计划,价值是有限的。真正的变化,是它开始把分散的身体信号、运动科学知识和行为反馈,整合成一个持续更新的人体决策系统。
论文中有一个例子很能说明这一点:一项针对 43 名耐力运动员、持续12 周的研究,用 HRV、训练、睡眠、饮食和主观健康数据来预测第二天的恢复状态和 HRV 变化。这个案例重要的不是模型本身多先进,而是它说明恢复不再被看作一个单一指标问题。恢复是训练刺激、睡眠、营养、心理状态和自主神经系统共同作用后的结果。
这和我过去做运动康复时的体会非常接近。
康复师看肌肉、骨骼、关节活动度和发力模式;运动生理师看心肺、代谢、乳酸和恢复;营养师看能量供给;主教练看周期和比赛目标。每个人都在看人体的一部分,而且每个人都可能是对的。真正的问题不是缺少专业知识,而是这些专业判断很难被实时整合。
所以,AI coach 真正模拟的不是一个教练,而是一个教练组。
一个运动员的真实状态不会按专业分工切开。肌肉疲劳、糖原消耗、睡眠不足、心理压力、动作代偿和疼痛恐惧,经常在同一个人身上同时发生。论文里讨论的 AI 恢复预测、营养个性化、疲劳识别和配速策略,本质上都在尝试把这些割裂的判断重新放进一个连续系统里。
耐力运动为什么会成为这个趋势的早期场景?论文给出的答案其实很清楚:耐力运动天然会产生大量连续数据,也天然依赖复杂的生理调节。马拉松、骑行、铁三、越野,看似是速度和耐力的竞争,本质上是代谢、热管理、补给、恢复、神经疲劳和心理状态的协同。
一个运动员“撞墙”,很少是某一个指标单独出了问题,而是糖原、血糖、配速、温度、补水、胃肠反应和神经疲劳共同失衡。一个人今天状态不好,也未必只是睡少了,可能是前几天训练负荷、压力、营养和环境应激叠加出来的结果。
论文提到 CGM 在耐力运动中的应用,我觉得这部分很有代表性。连续血糖监测让运动员可以看到运动过程中血糖变化,AI 再结合运动强度、历史摄入和个人反应,去辅助碳水补给策略。但论文也提醒,CGM存在生理延迟和设备误差,因此不能把血糖曲线机械地等同于即时能量状态。
这个提醒非常重要。
AI 进入运动,并不意味着我们可以简单相信更多数据。恰恰相反,越是数据丰富,越需要理解每一种数据的边界。CGM很有价值,但它有延迟;HRV 很有价值,但它不能单独解释疲劳;PPG很有价值,但它不是万能入口;IMU 可以帮助识别动作和疲劳,但佩戴位置、场景和模型训练方式都会影响结果。
所以,真正成熟的 AI 运动系统,不是把所有数据都变成一个确定答案,而是能处理不确定性。
这也是我对当前可穿戴行业比较警惕的地方。
PPG是现阶段可穿戴设备非常重要的基础技术。它让连续心率、脉搏波、HRV等信号能够低成本、低负担地长期采集。没有PPG,今天很多运动可穿戴产品都不可能成立。
但任何传感器都有能力边界。
PPG可以很好地参与心率趋势、压力和恢复等状态判断。但像最大摄氧量、睡眠分期这类复杂指标,涉及更复杂的生理机制和测量条件。如果只依赖 PPG 相关信号去估算,就必须明确它是估算,说明适用场景和误差边界。很多产品的问题,把估算包装成确定性测量。
论文在伦理和方法部分也反复强调类似问题:AI 应用仍然面临传感器误差、数据噪声、缺失值、标签错误、模型泛化不足、算法黑箱和外部验证不足。这说明 AI 不会自动让运动科学更严谨。如果底层数据和模型边界不清楚,AI 反而会让“伪精确”看起来更智能。
论文还提到一个很关键的限制:很多模型的训练数据不够多样,往往偏向年轻、男性、精英或西方运动员,导致模型在不同性别、年龄、运动水平和人群中的泛化能力不足。
这其实触及了AI 运动产品的一个根本问题:人体不是线性的,也不是同质的。
同样的训练负荷,对不同人可能是完全不同的刺激。同样的HRV变化,在不同人身上可能代表疲劳,也可能是适应过程中的正常波动。同样睡了 8 小时,有人恢复很好,有人仍然处在高压力状态。单一指标可以提示风险,但不能独立完成判断。
这也是论文强调多模态融合的原因。
恢复不应该只看 HRV,还要看睡眠、训练负荷、主观疲劳、近期饮食、环境压力和运动表现。补给不应该只看血糖,还要结合运动强度、历史摄入、胃肠反应、天气和比赛策略。训练建议不应该只看当天的 readiness score,还要理解长期适应曲线。
不过,即便模型更准确,也不意味着 AI coach 一定有效。
这里需要补进一个这篇 AI 耐力运动综述没有充分展开、但在真实产品里非常关键的问题:行为转化。
一篇关于身体活动行为的评论文章提供了很好的补充视角。它指出,过去几十年,公共健康领域一直在告诉人们“应该运动多少”“为什么运动有益”,但身体活动水平并没有因此显著改善。原因在于,人的运动行为并不只由理性认知驱动,长期坚持更依赖即时体验、愉悦感、自主性和短期反馈。
这对AI coach 很重要。
用户不会因为收到一个理论上更优的计划,就自动执行。我以前做康复时曾经以为,用户不执行方案是因为不自律。后来自己经历腰椎间盘突出,才意识到疼痛、恐惧和不确定感会极大影响一个人的行动能力。
一个处在疼痛或疲惫中的人,需要的不只是“最优方案”,而是安全边界、短期目标、即时反馈和确定性预期。
所以真正好的 AI coach,不仅要理解生理,还要理解行为。它必须把生理判断翻译成用户当下能完成的行动:今天练什么,练到什么程度,什么情况该停,多久可以进阶,异常反应如何处理。
这决定了 AI coach 和 dashboard 的区别。
dashboard 告诉你发生了什么。
AI coach 应该告诉你下一步怎么做,并且让这一步真的能被完成。
从这个角度看,AI coach 的核心能力不只是推荐训练计划,而是把运动科学、生理状态和行为心理学整合起来。它既要知道什么是科学上正确的,也要知道什么是这个人今天愿意做、敢做、能够坚持做的。
一个运动员的真实状态不会按专业分工切开。肌肉疲劳、糖原消耗、睡眠不足、心理压力、动作代偿和疼痛恐惧,经常在同一个人身上同时发生。论文里讨论的 AI 恢复预测、营养个性化、疲劳识别和配速策略,本质上都在尝试把这些割裂的判断重新放进一个连续系统里。
耐力运动为什么会成为这个趋势的早期场景?论文给出的答案其实很清楚:耐力运动天然会产生大量连续数据,也天然依赖复杂的生理调节。马拉松、骑行、铁三、越野,看似是速度和耐力的竞争,本质上是代谢、热管理、补给、恢复、神经疲劳和心理状态的协同。
一个运动员“撞墙”,很少是某一个指标单独出了问题,而是糖原、血糖、配速、温度、补水、胃肠反应和神经疲劳共同失衡。一个人今天状态不好,也未必只是睡少了,可能是前几天训练负荷、压力、营养和环境应激叠加出来的结果。
论文提到 CGM 在耐力运动中的应用,我觉得这部分很有代表性。连续血糖监测让运动员可以看到运动过程中血糖变化,AI 再结合运动强度、历史摄入和个人反应,去辅助碳水补给策略。但论文也提醒,CGM存在生理延迟和设备误差,因此不能把血糖曲线机械地等同于即时能量状态。
这个提醒非常重要。
AI 进入运动,并不意味着我们可以简单相信更多数据。恰恰相反,越是数据丰富,越需要理解每一种数据的边界。CGM很有价值,但它有延迟;HRV 很有价值,但它不能单独解释疲劳;PPG很有价值,但它不是万能入口;IMU 可以帮助识别动作和疲劳,但佩戴位置、场景和模型训练方式都会影响结果。
所以,真正成熟的 AI 运动系统,不是把所有数据都变成一个确定答案,而是能处理不确定性。
这也是我对当前可穿戴行业比较警惕的地方。
PPG是现阶段可穿戴设备非常重要的基础技术。它让连续心率、脉搏波、HRV等信号能够低成本、低负担地长期采集。没有PPG,今天很多运动可穿戴产品都不可能成立。
但任何传感器都有能力边界。
PPG可以很好地参与心率趋势、压力和恢复等状态判断。但像最大摄氧量、睡眠分期这类复杂指标,涉及更复杂的生理机制和测量条件。如果只依赖 PPG 相关信号去估算,就必须明确它是估算,说明适用场景和误差边界。很多产品的问题,把估算包装成确定性测量。
论文在伦理和方法部分也反复强调类似问题:AI 应用仍然面临传感器误差、数据噪声、缺失值、标签错误、模型泛化不足、算法黑箱和外部验证不足。这说明 AI 不会自动让运动科学更严谨。如果底层数据和模型边界不清楚,AI 反而会让“伪精确”看起来更智能。
论文还提到一个很关键的限制:很多模型的训练数据不够多样,往往偏向年轻、男性、精英或西方运动员,导致模型在不同性别、年龄、运动水平和人群中的泛化能力不足。
这其实触及了AI 运动产品的一个根本问题:人体不是线性的,也不是同质的。
同样的训练负荷,对不同人可能是完全不同的刺激。同样的HRV变化,在不同人身上可能代表疲劳,也可能是适应过程中的正常波动。同样睡了 8 小时,有人恢复很好,有人仍然处在高压力状态。单一指标可以提示风险,但不能独立完成判断。
这也是论文强调多模态融合的原因。
恢复不应该只看 HRV,还要看睡眠、训练负荷、主观疲劳、近期饮食、环境压力和运动表现。补给不应该只看血糖,还要结合运动强度、历史摄入、胃肠反应、天气和比赛策略。训练建议不应该只看当天的 readiness score,还要理解长期适应曲线。
不过,即便模型更准确,也不意味着 AI coach 一定有效。
这里需要补进一个这篇 AI 耐力运动综述没有充分展开、但在真实产品里非常关键的问题:行为转化。
一篇关于身体活动行为的评论文章提供了很好的补充视角。它指出,过去几十年,公共健康领域一直在告诉人们“应该运动多少”“为什么运动有益”,但身体活动水平并没有因此显著改善。原因在于,人的运动行为并不只由理性认知驱动,长期坚持更依赖即时体验、愉悦感、自主性和短期反馈。
这对AI coach 很重要。
用户不会因为收到一个理论上更优的计划,就自动执行。我以前做康复时曾经以为,用户不执行方案是因为不自律。后来自己经历腰椎间盘突出,才意识到疼痛、恐惧和不确定感会极大影响一个人的行动能力。
一个处在疼痛或疲惫中的人,需要的不只是“最优方案”,而是安全边界、短期目标、即时反馈和确定性预期。
所以真正好的 AI coach,不仅要理解生理,还要理解行为。它必须把生理判断翻译成用户当下能完成的行动:今天练什么,练到什么程度,什么情况该停,多久可以进阶,异常反应如何处理。
这决定了 AI coach 和 dashboard 的区别。
dashboard 告诉你发生了什么。
AI coach 应该告诉你下一步怎么做,并且让这一步真的能被完成。
从这个角度看,AI coach 的核心能力不只是推荐训练计划,而是把运动科学、生理状态和行为心理学整合起来。它既要知道什么是科学上正确的,也要知道什么是这个人今天愿意做、敢做、能够坚持做的。
Grivas, G.V.; Safari, K. Artificial Intelligence in Endurance Sports: Metabolic, Recovery, and Nutritional Perspectives. Nutrients 2025, 17, 3209. https://doi.org/10.3390/nu17203209
END
撰文 | 刘瑄伦
编辑 | 余帆
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,参与线上线下交流活动








