星标“医工学人”,第一时间获取医工交叉领域新闻动态~

这项源自麻省理工学院的技术,旨在通过读取语言肌肉的微弱信号,实现人与AI的无缝沟通。它承诺为失语者带来希望,并彻底改变我们与数字世界的交互方式。然而,从实验室走向大众市场,它必须跨越技术、社会接受度与商业化的多重挑战。
2025年9月8日,由麻省理工学院(MIT)媒体实验室走出的初创公司AlterEgo,正式向世界揭开了其同名产品的面纱。这款被形容为“近乎心灵感应”的可穿戴设备,承诺用户只需在脑中默念词句,便能与AI助手、应用程序乃至他人进行无声的交流。这并非科幻小说中的脑机接口,而是一种非侵入式的神经接口技术。它不读取你的思想,而是捕捉你“说话的意图”。

AlterEgo的首席执行官Arnav Kapur将此设备形容为一场“革命性的突破”。它所描绘的未来——在会议中无声地查询资料,在嘈杂的地铁里安静地回复信息,或者让因运动神经元病(ALS)而失去言语能力的人重新获得沟通的桥梁——无疑是激动人心的。然而,这项技术究竟是如何运作的?它在临床应用中的真实潜力如何?又能否克服可穿戴硬件普遍面临的市场阻力?
与马斯克的Neuralink等需要通过手术植入电极的侵入式脑机接口截然不同,AlterEgo的优势在于其“无创性”。华盛顿大学的电气与计算机工程师Howard Chizeck指出,这项技术避免了手术和感染的风险。
AlterEgo的核心在于解码亚发声(subvocalization)过程中的神经肌肉信号。其工作流程如下:
1. 信号捕捉:当一个人在内部默念单词时,即便面部没有任何可观察到的动作,大脑依旧会向发音相关的肌肉(如面部、下颌及喉部的肌肉)发送电信号。AlterEgo设备佩戴在耳朵及下颌周围,其内部的电极可以精确检测到这些微弱的神经肌肉信号。
2. AI解码:设备捕捉到的信号数据被实时发送给先进的AI模型进行分析。这些模型经过训练,能够识别特定信号模式与特定词语之间的对应关系,从而预测出用户想要表达的内容。
3. 信息反馈:一旦AI解码出用户的指令或问题,它便会执行任务(如搜索网络)并将音频信息通过骨传导耳机反馈给用户。这种反馈方式保证了私密性,只有佩戴者能听到声音。

AlterEgo最直接且意义深远的应用之一,是为那些因ALS、多发性硬化症(MS)、构音障碍(dysarthria)或发声困难(dysphonia)而面临语言障碍的患者提供帮助。
公司目前正在针对ALS和MS患者进行临床试验。Kapur表示,即便是那些发声系统中仅存微弱稀疏信号的患者,也足以被系统捕捉并使用。他透露,试验不仅覆盖了早期ALS患者,一些晚期患者也成功使用了该系统。
尽管前景光明,但试验结果尚未公开发表。专家对此也持谨慎乐观态度。Chizeck认为,对于早期ALS患者,该设备可能非常有用。但他同时指出,由于ALS是一种进行性疾病,会逐渐削弱患者对语言肌肉的控制能力,因此设备在疾病晚期的有效性可能会随之下降。他强调:“设备的性能最终取决于用户对语言肌肉的控制能力”。
截至2025年9月,AlterEgo尚未公布产品的具体上市日期和定价。这表明该技术距离大规模商业化仍有一段路要走。
在“无声语言接口”(Silent Speech Interface, SSI)这一前沿领域,AlterEgo并非唯一的探索者。该领域的研究主要集中在学术界,探索多种实现路径,包括:
1. 其他sEMG系统:利用表面肌电图(sEMG)来解码语言信号是SSI研究的一个主流方向。
2. 超声波与光学成像:一些研究机构尝试使用超声波或微型摄像头追踪嘴唇、舌头等发音器官的运动,来重建语言。
3. 集成化可穿戴设备:微软研究院的“QuietSync”项目,探索将传感器集成到耳机、眼镜等日常穿戴设备中,以实现无声交互。
Arnav Kapur为AlterEgo描绘了一个宏大的愿景:用户能够“以思想的速度口述”,与他人进行无声对话,甚至通过内置摄像头识别草图并即时生成应用程序。这代表了一种终极的人机交互形态——将计算、互联网和AI无缝地融入我们的日常生活,成为人类认知能力的延伸。
然而,理想与现实之间仍存在鸿沟。
首先,是社会接受度的挑战。Howard Chizeck对此表示疑虑,他指出:“人们与AI交互的方式有很多种,但在身上佩戴硬件设备往往会遇到阻力。例如,许多人不喜欢戴助听器,因为这会让你看起来与众不同”。AlterEgo若想成为大众消费品,其工业设计必须兼具时尚、舒适与“隐形”的特点。
其次,是技术精准度与鲁棒性。尽管早期研究取得了令人鼓舞的成果,但在真实世界复杂的噪声环境下,系统能否持续保持高精度的识别率,尤其是在用户进行移动、进食等日常活动时,仍有待检验。
再次,是市场定位的清晰化。在临床医疗领域,AlterEgo的需求是刚性的,它有望成为革命性的辅助沟通工具。但在大众消费市场,它需要与智能手表、智能耳机乃至未来的AR眼镜等设备竞争用户的“佩戴空间”。它所提供的“无声输入”功能,是否足以说服普通消费者为其买单,仍是未知数。
最后,关于隐私问题,AlterEgo的设计提供了一定的保障。Chizeck认为,由于它读取的是肌肉信号而非直接的大脑活动,且反馈是私密的骨传导音频,因此其隐私风险低于随时可能被窃听的语音助手(如Alexa)或侵入式脑机接口。
AlterEgo无疑是人机交互领域一项开创性的技术。它巧妙地绕开了侵入式脑机接口的技术与伦理壁垒,为实现更自然、更私密的数字交互开辟了一条可行的道路。在医疗领域的应用前景尤其值得期待。然而,若要真正飞入寻常百姓家,成为下一代计算平台的一部分,它不仅需要在技术上精益求精,更需要在产品设计与市场策略上,找到那个能让大众坦然接受的完美平衡点。未来的几年,将是考验AlterEgo能否将“近乎心灵感应”的承诺转化为现实的关键时期。
Nature: The ‘near-telepathic’ device that puts AI in your head. https://www.nature.com/articles/d41586-025-03000-z
END
撰文 | 刘帅
编辑 | 郝娅婷
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,
参与线上线下交流活动

推荐阅读
Nat. Biomed. Eng. | 复旦大学等多所院校团队利用大模型攻克结肠癌诊断“数据瓶颈”,让机器读懂病历自动标注
点击关注医工学人

本篇文章来源于微信公众号: 医工学人








