奧推網

選單
娛樂

專心“搞事業”的成長型甜美系歌手!訊飛音樂首個AI虛擬歌手亮相

智東西(公眾號:zhidxcom)

作者 | 程茜

編輯 | 漠影

你想粉一個聲音獨一無二的愛豆嗎?你腦海裡冒出來的第一個甜美聲音是什麼樣?現在,這一切都有了答案。

今年開學季,上海音樂學院出現了一位粉頭髮、大眼睛、頭頂一根呆毛的元氣少女偶像歌手。這正是科大訊飛旗下訊飛音樂的首位AI虛擬歌手Luya(露芽),剛出道就已經擁有兩首單曲——《北極星與流行雨》和《迷霧之中的微光》,其中,《迷霧之中的微光》在QQ音樂熱歌榜排名17。

從洛天依、初音未來到華智冰、柳葉熙,越來越多的虛擬偶像已經“出道”,唱歌、跳舞都不在話下。而Luya與她們最大的不同則是“成長型”,她擁有甜美可愛的外形、聲音,還能夠在技術、能力不斷提升的同時不斷成長。

值得一提的是,Luya的聲音並不是真人發出,而是由AI創造,科大訊飛AI研究院副院長、訊飛音樂首席科學家江源說:“依託科大訊飛研究院在語音和人工智慧領域的技術儲備,使得Luya的形象逐漸飽滿。”

1999年成立的科大訊飛,已經在語音及AI技術領域下積澱了20餘年,2019年官宣進入音樂賽道。科大訊飛高階副總裁、訊飛研究院院長鬍國平曾在訊飛音樂釋出會上說:“語音技術融入音樂,勢必對音樂行業有深刻影響,甚至幫助整個行業實現質的飛躍。”

智東西與科大訊飛AI研究院副院長、訊飛音樂首席科學家江源進行了深入交流,從Luya的“出道故事”,去揭開AI虛擬歌手背後的黑科技及AI+音樂未來的融合路徑。

#FormatStrongID_1#

2019年7月訊飛音樂成立,致力於專業音樂製作、多元化宣發、藝人經紀及AI音樂創新產品研究。截至2022年9月,訊飛音樂出品歌曲總播放量突破570億次,播放過億歌曲100餘首,各音樂平臺上榜歌曲數百首。作為訊飛音樂的首位AI虛擬歌手,Luya印證了訊飛音樂在AI+音樂領域探索的更進一步。

作為一名歌手,其亮點離不開優秀的作品和好聽的音色,這放在AI虛擬歌手上同樣如此。

不過,為了打造虛擬偶像的獨特性,很多玩家則選擇了完全不同的路徑,一種是虛擬偶像的動作、聲音、思考都來自於幕後穿戴動作捕捉裝置的真人,也就是“中之人”;一種則是用AI創造音色,為虛擬偶像打造獨一無二的聲音。

選擇後一種方式的訊飛音樂,其首個AI虛擬歌手Luya的音色也成為了其亮點。

那麼具體而言,打造一個AI虛擬歌手需要幾步?確定人設、AI創造音色、打造外形、出道。對於Luya來說,其中最重要的就是AI創造音色,江源告訴智東西,這一套流程下來,用AI創造Luya的音色他們就花了大量時間磨合除錯。

最初,Luya的設定就是性格爽朗、古靈精怪的天才少女,這之後,她的外形和音色也都延續了這一特點。在Luya釋出單曲下方的評論區中,可以看到網友討論的焦點都在其甜美、元氣滿滿的聲音上。

Luya的音色並不是來源於某一個具體的真人,而是訊飛音樂基於AI不斷調節、最佳化聲音屬性的同時去創造一個獨一無二的聲音。

江源告訴智東西,為了找到符合Luya人設的聲音,他們構建了一個擁有海量音色的聲音庫,透過多維的手段,利用這些音色建立一個音色空間模型,再將上百萬的聲音樣本進行拆解、調節,這個調節過程可能包括聲音的甜美程度、性別變化、年輕程度等。

訊飛音樂在對這些細節不斷組合調整的過程中,使得Luya的聲音形象逐漸飽滿、成熟。

除此以外,不同於一個成熟的歌手,Luya的定位更像一個不斷成長的大學生,同時也是在音樂世界徜徉探索的“精靈”。

提及AI虛擬歌手,你腦海中的雛形可能是更早期的洛天依、初音未來,以及最近引起熱議的樂華娛樂虛擬偶像團體A-SOUL,但Luya與這些虛擬偶像最大的不同還在於,

“她是成長型歌手”

江源說:“和洛天依、初音未來的不同之處在於,Luya並沒有被在最開始就定義成完美,她更像我們的女兒,隨著技術和能力的進步,而不斷成長。”

而這些特點也凸顯出了AI虛擬歌手Luya的強標識性特徵。那麼,在獨一無二的Luya背後,還有哪些黑科技?

#FormatStrongID_4#

說的不如唱的好聽,我們可以先來感受一下Luya的真正實力。

//oss。zhidx。com/uploads/2022/09/632ab032ecc42_632ab032e8d16_632ab032e8cf1_LUYA-迷霧之中的微光。mp3//oss。zhidx。com/uploads/2022/09/632ab07ec8ae0_632ab07ec4dee_632ab07ec4dcb_LUYA-北極星與流星雨。mp3

這兩首歌正是Luya已經發布的單曲,這些元氣滿滿的聲音不是現實中某人發出,而是由AI創造的,這背後的黑科技也正是科大訊飛的核心優勢。

不同於很多AI虛擬歌手背後的“中之人”,世界上,幾乎找不出與Luya的音色完全相同的人聲,這背後正是依靠訊飛音樂的“x-vocal”技術。

上文我們提到的訊飛音樂建立了一個具有海量音色的聲音庫,再由技術專家、混音師、音樂創作者、愛好者對聲音進行挑選、製造,在這個龐大的音色空間中,找到最終符合Luya聲音定位的專屬音色,而這個就是“x-vocal”技術的實現過程。

從技術角度而言,其難度在於,即使訊飛音樂構建了一個龐大的音色空間,但其中可調節的維度及其對應的物理解釋、人對其的物理感知量,都是很難去進行調節的。

因此,江源解釋道,他們會定標一些聲音的程度,如年齡層次、甜美程度、高亢沙啞等,透過人工判斷並給予其人工定標,再圍繞著這一過程,去拆解主線條上的維度。

再加上“聲音是一個動態變化的過程,因此AI虛擬歌手背後的技術難度其實非常高”。

從音樂角度來看,就如同“一千個觀眾眼中有一千個哈姆雷特”,每個人會對音樂作品產生不同的理解。因此,Luya背後不光蘊含著黑科技,還有音樂向的理解存在。

在用AI創造Luya音色的過程中,技術人員對於音色的理解和評價逐漸從技術角度延伸到大眾語言的角度。“我認為這是非常有趣的,對我們有很大的幫助和提升。”

具體而言,聲音對於一個人有時候具有代表性作用,你可能聽到“咳嗽聲”就能知道是誰,但相比於作為歌手的聲音,其判斷維度有很大不同。因此,如果單純按照說話的聲音去構建一個發音模型,對於歌聲來說是不適用的。

因此,訊飛音樂在技術積澱的同時,也在加深對音樂的理解,而Luya也在不斷成長。江源說:“我們希望打造一個不斷成長,並給Luya不斷賦能的過程。”

目前而言,訊飛音樂對於Luya的包裝仍然是不成熟的,隨著技術和能力的不斷提升,Luya的未來具有無限可能。

#FormatStrongID_5#

很多人可能會有這樣的好奇,現在已經有很多真人偶像,為什麼我們還會需要AI虛擬歌手?想要回答這個問題,我們可以先從真人偶像和AI虛擬歌手的共性說起。

事實上,AI虛擬歌手並不神秘,她的成長路徑和真人歌手有很多相似之處,其真正價值在於音樂作品,AI技術也只是其中的輔助。

江源談道,中之人的優勢在於可以和粉絲進行互動,除音樂外,這些虛擬偶像被包裝的元素可能更多。而相對於聲音創作,中之人會比AI的流程更加輕鬆一點。

歸根結底,

音樂本身的價值更為關鍵

。談及Luya的下一步計劃,江源透露,他們還是希望透過音樂內容去撬動更多的粉絲群體,更強調她的音樂屬性。

因此,為了積澱Luya在音樂領域的實力,同時助力AI+音樂領域的融合,Luya在今年開學季進入上海音樂學院“音樂工程系·訊飛音樂 聯合研發中心”。

接下來Luya的成長計劃將著眼於AI輔助創作能力提升,初期,Luya將憑藉其AI合成的音色參與歌曲演繹,未來會進一步延伸至AI輔助作詞、作曲等領域。

江源還談道,Luya會在上音的實驗室裡聯合專業領域進行音樂創作等,而這一部分內容也會進一步賦予給Luya,這也是訊飛音樂推動Luya未來能力不斷成長的關鍵過程。

總的來看,AI虛擬歌手與真人歌手並不會相互取代,反之,憑藉其優秀的音樂作品會擁有一眾粉絲群體。

Luya現階段會基於自己的人設特點,從人格化角度與喜愛她的粉絲、聽眾交流回復,接下來會透過構建自己的知識庫,依託知識積累沉澱,與粉絲進行更直接的互動。

“我相信,AI虛擬歌手會變得更加有血有肉。”江源說。他們的價值也是可以不斷被挖掘,並超出人類預期的。他認為,三年到五年的時間,AI虛擬歌手就可以在音樂領域構建自己的知識庫,擁有專家級別的理解和認識。

依託於Luya的成長型特性,她也會隨著訊飛音樂在語音和AI技術領域的不斷髮展而成長。

AI技術的發展逐漸走向千行百業,並真正落地其中。AI與音樂的融合並不止於此,訊飛音樂也一直在探索創新路徑。

#FormatStrongID_6#

AI+音樂已經成為AI技術應用落地的重要領域,科大訊飛依託於其深厚的技術積累,開始發力,Luya也憑藉其甜美的音色在各大平臺吸引了一眾粉絲。不同於其他領域,人們對於藝術的看法總是千人千面,江源說:“這也是我們在研發過程中覺得有趣的一點。”Luya讓我們看到了訊飛音樂在這一領域探索的無限可能。

未來,隨著Luya越來越成熟,AI虛擬歌手更加立體,AI技術的不斷進步,這一領域也許會迸發更多元的可能性。