脑机接口:让失声者“重新开口”的科技突破
日期:2025-07-18 20:50:48 / 人气:30

一、技术突破:首次实现自然语音的脑机接口
• 研究背景:神经工程领域长期致力于实现“用大脑直接说话”,但过往脑机接口依赖文字拼写或按钮输入,合成语音机械单调,无法还原自然语言的韵律与情感。
• 研究成果:2025年6月12日,加州大学戴维斯分校联合多机构在Nature发表研究,首次通过大脑运动皮层神经信号实时生成带有语调、节奏与个性化音色的自然语音,让渐冻症(ALS)患者成功说出“你好”“今天感觉很好”等句子,并能调控语调、尝试哼唱旋律。
二、技术原理:从神经信号到自然语音的闭环系统
• 神经信号采集:在患者大脑左侧前中央回腹部(控制面部和喉部运动的关键区域)植入256通道微电极阵列,记录“试图说话”时产生的电信号。
• 神经解码:采用“双路径解码”机制,两套深度神经网络模型分别预测语音内容(音素概率及声学特征)和副语言信息(语调、情绪等),还原语义与情感表达。
• 语音合成与实时播放:借助屏幕提示语引导患者“尝试说话”,记录神经活动并生成目标语音,构建神经—语音配对数据训练模型;基于Transformer架构的深度学习模型实现因果解码,个性化声码器将神经参数转化为清晰语音,通过扬声器实时播放。
三、技术优势:高精度与低延迟的自然表达
• 识别准确率高:对疑问语调识别准确率约90.5%,词语重读识别准确率约95.7%;自由表达任务中合成语音音频质量与提示语条件下结果相当(Pearson相关系数约0.79±0.05)。
• 实时性强:整个过程在毫秒级时间窗口内完成闭环,从神经信号产生到声音输出延迟极低,几乎可实现实时对话,远超以往脑—机语音系统。
• 个性化音色:声码器训练融入患者早期语音录音,合成语音在音色、语调上更贴近患者原有嗓音特征,具有高度个体化识别度。
四、研究意义:重建失语者的语言与身份
• 技术层面:实现了用“大脑说话”的突破,为失语者重建语言、身份与人际连结提供了全新可能,让表达不再依赖声音或动作,直通思维本身。
• 应用前景:研究团队已将数据与代码开源,未来有望推广至中风、脑瘫、喉癌术后等多类失语人群;探索与非侵入式脑电技术(如EEG)结合降低使用门槛,与AI语义理解系统融合构建新一代自然语言交互平台。
五、现存挑战:从实验室走向日常的难题
• 表达依赖引导:目前患者需根据屏幕提示语“默念”或“尝试说话”,系统才能识别意图并合成语音,尚未达到完全由大脑自主驱动的自由交流。
• 样本数量有限:技术仅在一位ALS患者中完成验证,需评估其在不同个体、不同病理状态下的通用性与稳定性。
• 语音表现差距:生成语音在语调灵活性、节奏自然度与情感表现方面与真实人类对话仍存在一定差距。
• 设备优化问题:需解决设备的侵入性、长期使用的稳定性与适配性问题,以推动技术从实验室走进真实生活。
六、结语
脑机接口技术让失声者“重新开口”,不仅是科技的重大突破,更是对失语者语言权利与尊严的归还。尽管目前仍处于早期探索阶段,面临诸多挑战,但它为我们展现了未来语言交流的新范式——直接来源于思维本身。随着技术的不断优化与推广,有望帮助更多失去语言能力的人再次被世界听见,开启一个全新的语言纪元。
作者:先锋娱乐
新闻资讯 News
- 倪萍勇揭金鸡奖黑幕,迟蓬演技终...09-03
- 鹿晗演唱会喊话“老婆好”,双向...09-03
- 邓超现身南昌买一毛钱奶奶凉菜 夸...09-03
- 孟佳穿迷你短裙秀 “漫画腿”:舞...09-03