奧推網

選單
娛樂

“80後”青年專家紮根重慶 解鎖智慧汽車人機互動新模式

馬鴻鵬指導同事進行智慧車載系統測試。(受訪者供圖)

前不久,長安汽車旗下的歐尚汽車智慧快樂座艙在渝釋出,將人工智慧技術與汽車使用場景深度融合,打造全球首發的車外語音互動系統。

這一互動系統,來自科大訊飛智慧汽車重慶分中心“80後”青年專家馬鴻鵬的團隊。

2018智博會上,科大訊飛董事長劉慶峰宣佈將西南總部落地重慶,同時落地的還有科大訊飛智慧汽車重慶分中心,由來自東北的馬鴻鵬擔任該中心總經理。從此,馬鴻鵬的團隊開始與重慶結緣。

4年來,科大訊飛與長安汽車等重慶車企共建聯合實驗室,在汽車電子智慧化的技術研發、產品設計以及整車應用領域展開合作,取得了多項技術突破。

“我們在重慶的團隊平均年齡27歲左右,是一群有技術、有理想、有衝勁的科技青年,致力於透過‘AI+汽車’,解鎖智慧汽車人機互動新模式,賦能重慶汽車產業開創新格局。”5月4日是五四青年節,馬鴻鵬在接受重慶日報記者採訪時如是說。

反覆測試建立龐大的場景知識庫

讓車機系統精準理解說話人的前言後語

“小安你好,幫我查一下北京的天氣。”

“好的,北京天氣晴,白天氣溫20℃。”

“再幫我訂一張去那兒的機票。”

……

這樣的對話,在人與人交流中再簡單平常不過。但是,對於人機互動而言,想要和機器持續對話,並讓機器理解“那兒”就是上文所指的北京,並非易事。

“人坐在車內,一次喚醒車機系統就實現多個指令,還要讓系統能前言後語結合理解,這種互動方式是之前沒有的。”馬鴻鵬說道,要達到這樣的效果,機器需要記憶和理解當前說話人的意圖和場景,因此就需要覆蓋儘可能多的場景和可能的問法。這樣一來,演算法複雜度會呈幾何級數增長,使軟體的開發和維護都有較大難度。

為了實現這一看似簡單的“高難度”操作,馬鴻鵬帶領著20多人組成的團隊入駐長安汽車,反覆測試並建立了一個龐大的場景知識庫。

“通常車內常用指令不超過2000種,但我們在車機上內建了常用指令近6000條,以及不常用指令近2萬條,才實現了精準獲取使用者指令。”馬鴻鵬說。

如今,搭載了相關技術的飛魚OS已經在長安CS95、CS75等車型上使用,助力重慶汽車在智慧汽車賽道拔得頭籌。

訓練外語語音識別系統能理解會思考

助力“重慶造”汽車走向國際市場

隨著智慧汽車產業發展,不少重慶汽車品牌也開始走向國際市場。智慧汽車在海外使用,必須適用當地的語種,而在過去,外語的車載語音識別及合成系統被國外企業掌握,國內車企只能使用國外企業的語音技術。

“過去很長一段時間長安汽車在面向中東、南美等海外發行的車型中,語音識別系統一直是採用的國外技術,安全問題是最大的考量。”馬鴻鵬坦言。

為了解決這一“卡脖子”問題,馬鴻鵬團隊聯合科大訊飛研究院展開了長安汽車車載外語語音識別及合成系統研發。

“做車載外語識別,不僅需要聽懂,還要理解其他國家的語言文化習慣,甚至同一語種不同地區的口音,這就需要有強大的識別模型和機器學習做支撐。”馬鴻鵬解釋說,車載語音的“識別”分為“語音識別”和“語義識別”兩個技術層次,“語音識別”相當於人的嘴巴和耳朵,負責表達和獲取;“語義識別”相當於人的大腦,負責思考和資訊處理。為了實現外語的能聽會說、能理解會思考,團隊還找來“外援”,邀請一大批留學生和外語專家加入語音系統的訓練中,透過演算法的積累和機器學習,讓車載外語語音系統更穩定高效。

2021年,這套車載外語語音識別系統已成功實現國產化,長安汽車海外發行的車型均採用了這一國產系統。

獨創神經網路降噪演算法和“冷啟動”系統

讓車主可以在車外喚醒車輛“開出來”

在歐尚汽車上打造全球首發的車外語音互動系統,也是智慧汽車領域的一大技術創新。

“以前汽車的語音互動都在車內,實際上車外智慧互動也是使用者的需求。”馬鴻鵬說,以往使用者在用車場景中,常會有開門難、挪車難等痛點,而這套車外語音互動系統可以讓車主在車外喚醒車輛,比如在擁擠的停車場,可以叫它“把車開出來”,車輛即可自動向前駛出。購物歸來雙手不方便開門,也可以說一聲“開啟後備廂”,後備廂即可自動開啟。

車外語音互動較車內語音互動來說,難點在於如何保障在有車外噪音等複雜環境下,機器能聽清楚並執行指令。馬鴻鵬介紹,為了實現車外的人車互動,他和團隊獨創了神經網路降噪演算法和“冷啟動”系統兩項技術,讓車外語音互動系統做到360度語音降噪和無死角識別覆蓋,實現穩定高效的車外語音互動。

“汽車革命的下半場是智慧化、網聯化、共享化。”他表示,未來,他們還將繼續紮根重慶,進一步探索汽車多語種、多模態互動技術,為重慶的車域生態夥伴提供更具有生命力和創新力的智慧化場景服務,助力重慶汽車智慧製造再上臺階。(記者 張亦築 實習生 冉羅楠)