奧推網

選單
娛樂

電腦合成的聲音能讓霍金逐字逐句地說話嗎?科學家用電腦幫他說話!

人們在回憶斯蒂芬·霍金的許多往事時,也許最令人難忘的是他的談話。罹難患肌萎縮性脊髓側索硬化症的霍金,後半生只能依靠輪椅活動,疾病也奪取了他說話的能力,但科學家透過電腦合成,重新塑造了他的聲音,並且為世人所傾聽。

然而,這個過程相當艱難。霍金不得不抽動臉頰上的肌肉來控制一臺幫助他逐字逐句造句的電腦。而那些因疾病或中風而失去說話能力的人,也可以用類似的方法,用頭部或眼部運動來控制電腦游標選擇字母和拼寫單詞。

但是,這些方法最多隻能幫助使用者在一分鐘內產生不超過10個單詞。這比平均每分鐘150個單詞的自然語速要慢得多。

更好的交流方式是直接閱讀一個癱瘓者的大腦,然後將這些閱讀轉化為合成語言。美國加州大學舊金山分校神經外科醫生愛德華·張在《自然》雜誌上發表的一項研究就描述了這種技術。說話需要精確控制嘴唇、下巴、舌頭和喉嚨的近100塊肌肉,才能發出構成句子的特有的呼吸和聲音。透過測量控制這些聲道肌肉的大腦訊號,張博士已經能夠使用計算機精確地合成語音。

參與張博士的這項研究的志願者是5名癲癇患者,作為治療的一部分,他們的大腦中被植入了電極。張博士及其同事們用這些電極記錄了志願者們大聲說出幾百句話時的大腦活動。具體來說,研究人員跟蹤了負責控制聲道肌肉的大腦部分的活動。

為了把這些訊號轉換成語音,他們做了兩件事。首先,他們研製了一個計算機程式來識別這些訊號的含義。同時,他們透過給程式輸入電極輸出的資料,以及聲道在發出測試語句的聲音時所採用的形狀表徵來實現這一目的。這些資料是幾十年來對聲音的研究得出的。然後,當程式學習了這些關聯後,就可以把電極訊號轉換成聲道結構,從而轉換成聲音。

這一原理得到了證實,張博士和他的團隊繼續證明,即使當志願者的啞聲模擬,而不是大聲說出來,他們的系統也可以合成語音。雖然精度不高,但這是一個重要的進步。一個可以滿足類似霍金這樣的病人需求的實用裝置,可以對大腦訊號做出反應,而這些訊號只需要移動很少的肌肉,甚至根本不動。啞聲模擬是一個踏腳石。

研究小組還發現,大腦訊號和語言之間的關係在人與人之間非常相似,因此他們的方法可以用來建立一個通用模板,使用者可以對其進行微調。這也將簡化該技術的實際應用過程。

到目前為止,張博士的研究物件都是能正常說話的人。下一個階段將是詢問他的系統是否能適用於那些不能說話的人。張博士所做的與現在已經成熟的使用大腦-計算機對接的領域類似,這個領域允許癱瘓的人僅僅透過思考他們想做什麼來控制肢體運動。恢復語言能力是一項比移動肢體更加複雜的任務,但在原理上卻足夠相似,可以給那些與已故霍金博士有相似處境的人帶來希望。