智東西(公眾號:zhidxcom)
編譯 | 金碧輝
編輯 | 程茜

智東西6月16日消息,據(jù)外媒New?Atlas?6月14日報道,美國加州大學戴維斯分校(UC Davis)研究團隊開發(fā)世界首例新型腦機接口(BCI)系統(tǒng),首次讓一名ALS患者(肌萎縮側(cè)索硬化癥,俗稱漸凍癥)通過腦內(nèi)植入設(shè)備,不僅實現(xiàn)實時說話,還能“演唱”簡單旋律,從信號采集到語音生成的全流程僅需10毫秒。

這里的“演唱”是指患者并非通過傳統(tǒng)聲帶發(fā)聲,而是通過BCI系統(tǒng)將神經(jīng)信號轉(zhuǎn)化為電子合成音,輸出三個預設(shè)音高的旋律片段。這種“演唱”本質(zhì)是系統(tǒng)對患者神經(jīng)意圖的解析與語音合成,有別于自然歌唱行為。

新研發(fā)的BCI系統(tǒng)通過手術(shù)植入的四組微電極陣列,捕捉大腦負責語言輸出區(qū)域的神經(jīng)信號,結(jié)合低延遲處理與AI解碼模型,將患者試圖說話時的肌肉控制信號轉(zhuǎn)化為語音,并通過語音克隆算法還原其患病前的聲音特征。

從信號采集到語音生成的全流程僅需10毫秒,加州大學戴維斯分校研究團隊開發(fā)的新型BCI系統(tǒng)使患者能自然參與對話,甚至打斷他人發(fā)言,這是傳統(tǒng)BCI系統(tǒng)難以實現(xiàn)的交互體驗。

讓漸凍癥患者實時對話、“哼唱”旋律!美國高校腦機接口新進展,延遲僅10ms▲BCI設(shè)置和使用語音合成技術(shù)的研究參與者

相關(guān)研究成果6月11日發(fā)表于學術(shù)頂刊Nature上,美國加州大學戴維斯分校研究團隊最新研發(fā)的BCI系統(tǒng)被學界稱為“Speech BCI領(lǐng)域的圣杯”。

讓漸凍癥患者實時對話、“哼唱”旋律!美國高校腦機接口新進展,延遲僅10ms

▲美國加州大學戴維斯分校研究團隊研發(fā)BCI系統(tǒng)的相關(guān)成果發(fā)表于學術(shù)頂刊Nature上

論文地址:

https://www.nature.com/articles/d41586-025-01818-1

一、神經(jīng)信號捕捉與低延遲處理雙突破,漸凍癥患者說話“零卡頓”

據(jù)外媒New?Atlas?6月14日報道,戴維斯分校研究團隊開發(fā)的新型BCI系統(tǒng)的核心在于通過植入大腦運動皮層的微電極陣列,直接獲取患者試圖說話時的神經(jīng)活動信號。

不同于“讀心術(shù)”,新型BCI系統(tǒng)的原理是翻譯患者大腦控制發(fā)音肌肉的指令,而非讀取抽象思維。AI驅(qū)動的解碼模型經(jīng)過訓練,能實時將神經(jīng)信號轉(zhuǎn)化為文本,再通過語音合成器輸出。

讓漸凍癥患者實時對話、“哼唱”旋律!美國高校腦機接口新進展,延遲僅10ms▲研究參與者閱讀屏幕文本的神經(jīng)信號有助于訓練AI解碼器模型

二、從“屏幕選詞”到“自發(fā)插話”,新型BCI系統(tǒng)讓“說話”更像真人

據(jù)外媒New Atlas報道,今年4月,美國加州大學伯克利分校與舊金山分校曾公布類似BCI技術(shù),但美國加州大學戴維斯分校的研究團隊研發(fā)的BCI系統(tǒng)在自然表達維度實現(xiàn)突破。

在前沿交互能力的展現(xiàn)上,加州大學戴維斯分校研發(fā)的BCI系統(tǒng)不僅能捕捉患者發(fā)音時的“啊”、“哦”、“嗯”等語氣詞,還可借助神經(jīng)信號解析陳述句與疑問句句調(diào)差異,甚至能對單詞重音位置進行識別。

據(jù)外媒報道,從加州大學戴維斯分校研究團隊的系統(tǒng)演示視頻透露,患者可通過設(shè)備輸出三個預設(shè)音高的旋律片段,其AI解碼器突破傳統(tǒng)訓練數(shù)據(jù)限制,成功處理生造詞匯的語音合成。

相較于過往BCI系統(tǒng)僅能輸出預設(shè)文本,加州大學戴維斯分校研究團隊技術(shù)在自然語言情感表達與語義靈活性上實現(xiàn)實質(zhì)提升。

三、腦機接口克隆患者原聲實現(xiàn)連續(xù)對話,漸凍癥患者率先受益

加州大學戴維斯分校研發(fā)的BCI系統(tǒng)的一大亮點是通過患者患病前的語音樣本訓練克隆算法實現(xiàn)個性化語音合成。

該論文的作者、神經(jīng)科學家謝爾蓋·斯塔維斯基(Sergey Stavisky)在論文發(fā)表同期接受多家外媒采訪時透露:“即時語音合成技術(shù)能讓患者更自然地融入對話,減少因傳統(tǒng)BCI系統(tǒng)延遲導致的交流中斷。”

荷蘭馬斯特里赫特大學的計算神經(jīng)科學家克里斯蒂安·赫夫(Christian Herff)在學術(shù)頂刊Nature同期評論中評價道:“這是真正的自發(fā)連續(xù)語音,BCI終于從實驗室走向現(xiàn)實溝通?!?/p>

目前加州大學戴維斯分校的研究雖僅涉及1名ALS患者,但團隊已計劃招募更多因中風、腦損傷等不同病因?qū)е率дZ的患者,以驗證技術(shù)的普適性。

在外媒看來,這一成果標志著BCI從“文字輸出”向“自然語音交互”的跨越,為全球千萬癱瘓患者帶來更具尊嚴的溝通方式。

結(jié)語:腦機接口技術(shù)突破背后,BCI設(shè)備成本與普及性成挑戰(zhàn)

加州大學戴維斯分校的研究突破可能為全球約30萬漸凍癥患者及其他神經(jīng)退行性疾病患者帶來希望。或許未來,漸凍癥患者能像常人一樣打斷對話、用語氣表達情緒,但技術(shù)落地仍需跨越多重關(guān)卡。單病例研究的局限性、不同患者大腦信號的個體差異、長期植入的安全性,以及AI模型對復雜語境的適應(yīng)性,均需后續(xù)研究驗證。

此外,BCI設(shè)備的成本與普及性也是現(xiàn)實挑戰(zhàn)。當這項技術(shù)從頂尖實驗室走向臨床,或許還需要5到10年的迭代。然而,從伯克利分校的屏幕選詞到美國加州團隊的實時歌唱,腦機接口正以肉眼可見的速度突破邊界。正如赫夫所言:“這不是概念,而是真實的、自發(fā)的語言重生?!?/p>

來源:Nature、New?Atlas