星标“医工学人”,第一时间获取医工交叉领域新闻动态~

一直以来,科学家们不停在探索直接从大脑中解码语言的新方法。来自斯坦福大学等科研团队的科学家们成功开发出一种语音脑机接口(BCI),它能够实时地、准确地将一个人“心中默想”的句子直接翻译成文字。对于因肌萎缩侧索硬化症(ALS)或中风而失去说话能力的人来说,这无疑是一项革命性的突破。在实验中,参与者仅凭想象说话,系统就能从一个超过12万单词的庞大词汇库中解码出他们想表达的内容,其体验远比需要费力“尝试”发声的传统BCI更为轻松。

1. 提升语音BCI的实用性和用户体验:目前的语音BCI大多要求用户“尝试”说话,这个过程对瘫痪患者而言可能非常疲劳,且速度受限。通过解码更为轻松的内部言语,该研究为开发更舒适、高效的交流辅助工具开辟了新途径。
2. 直面并解决了BCI的“精神隐私”伦理难题:随着BCI技术逼近“读心”的边界,如何保护用户最私密的“精神隐私”,防止其内心想法被无意或恶意解码,已成为一个迫在眉睫的伦理难题。该研究不仅证实了这种可能性,更重要的是,它前瞻性地开发并验证了两种行之有效的解决方案来保护用户隐私。
“我们正在为那些被禁锢在自己身体里的人们打开一扇新的沟通之门,”该研究的主要作者Erin M. Kunz表示,“但我们从一开始就意识到,这扇门必须有一个只有用户自己能控制的锁。”这个“锁”正是该研究最深远的创新所在。为解决这些问题,研究团队另辟蹊径,首次开发出一种能实时解码更轻松的“内部言语”的BCI系统。
1. 内部言语、外部言语和感知言语在大脑运动皮层共享神经表征:研究发现,无论是尝试说话(Attempted Speech)、在脑中默想(即内部语言,Inner Speech),还是听取语音(Perceived Speech),其在大脑运动皮层的神经活动模式都高度相关(图1)。内部言语和感知言语的神经信号像是尝试说话信号的“缩小版”或“弱化版”(图2),它们共享相同的神经几何结构,但调制强度较低。

图1.内隐语音、感知语音和默读在中央前回腹侧和中部的表征。

图2. 内隐语音和感知语音是运动皮层中尝试发声的“缩小版”
2. 成功实现实时的内部言语解码:研究团队成功开发并演示了一款可以实时解码内部言语的BCI系统(图3)。参与研究的严重构音障碍者能够仅通过默想句子,就将其从一个包含125,000个单词的大词汇库中解码出来,并转化为文本和语音。

图3. 自定步调内隐语音的实时解码。
3. 无指令的内部言语可被部分解码:研究证实了人们对于“读心术”的担忧并非空穴来风。在一些认知任务中(如默数或记忆序列),即使没有明确指示,BCI系统也能够解码出参与者自发的、私密的内部言语片段(图4、5)。

图4. 序列回忆任务引发的非指令性内隐语音可以从i6v解码,探究在自然认知任务中(即没有被告知要“内心说话”的情况下)自发产生的内隐语音是否也能被解码。

图5. 在一个更自然、更开放的认知任务(计数)中,探测并解码非指令性的、自发的内隐语音,从而进一步证明解码私人想法的可能性。
4. 存在一个区分“意图”的神经维度:尽管表征共享,研究人员发现了一个明确的“运动意图维度”(motor-intent dimension),如图6所示。这个维度能够可靠地区分用户是仅仅在“想”一句话,还是真的“打算说”出来。这个发现对于解决隐私问题至关重要。

图6. 运动皮层包含一个表征运动意图的神经维度,可帮助区分尝试发声与内隐语音。
5. 提出并验证了高级隐私保护策略(图7):
-
“意象沉默”(Imagery-Silenced)训练法:通过在训练数据中将内部言语明确标记为“沉默”,教会解码器在用户只是思考而非意图交流时保持静默,有效防止信息泄露。
-
“关键词”(Keyword)解锁机制:为基于内部言语的BCI设计了一个“精神密码”。用户只需在心中默念一个特定的、复杂的关键词(如“ChittyChittyBangBang”),就能“解锁”解码功能,实测准确率高达98.75%。 这种设计将控制权完全交还给用户。

图7. 提出并验证两种实用的解决方案,以防止语音BCI无意中解码用户的私密内隐语音,直接应对本研究提出的伦理挑战。
通过在四名参与者(包括一名完全失语者)中进行微电极阵列记录,研究有力地证明了Inner Speech在大脑运动皮层中具有稳定且可解码的神经表征。
该新型语音BCI核心贡献在于,不仅成功开发出首个能够实时解码大词汇量内部言语的BCI,为瘫痪患者提供了一种更低功耗、更舒适的交流方式,而且前瞻性地直面并解决了“精神隐私”这一重大伦理挑战,该语音BCI的发展开辟了多个激动人心的方向:
-
技术的深化与验证:虽然研究中提出的隐私保护策略效果显著,但仍需在更长期的、在线实时的解码场景中进行全面验证,以确保其在日常使用中的鲁棒性。
-
解码维度的拓展:研究已经证实,在计数等认知任务中可以解码出自发的内部言语 。未来的研究需要进一步探索在更广泛、更复杂的认知活动(如规划、逻辑推理、默读)中,内部言语的可解码程度和边界 ,这将极大地拓展BCI的应用场景。
-
个性化与普适性:研究承认个体在使用内部言语进行认知活动时可能存在差异 。未来的一个重要方向是研究这些个体差异,从而开发出能适应不同用户思维习惯的个性化解码模型。
-
应对技术进步带来的新挑战:当前技术尚无法在自由思考中解码出完整、清晰的句子。然而,随着记录技术的不断进步,未来或许能够实现更高精度的思想解码。因此,持续研究和开发更先进、多层次的隐私安全协议,对于应对未来技术的发展至关重要。
[1] Kunz, E. M., et al. (2025). Inner speech in motor cortex and implications for speech neuroprostheses. Cell, 188, 1-16. https://doi.org/10.1016/j.cell.2025.06.015
END
撰文 | 郝娅婷
编辑 | 员蓉
审核 | 医工学人理事会
扫码加入医工学人,进入综合及细分领域群聊,参与线上线下交流活动

推荐阅读
点击关注医工学人
本篇文章来源于微信公众号: 医工学人