奧推網

選單
文化

AIGC,喊出了元宇宙的"芝麻開門"

作者 | 陳平安

2022年8月,在美國科羅拉多州博覽會上,一幅名為《太空歌劇院》的繪畫作品贏得了數字類別的一等獎,但不少人對於這個獎項的授予並不服氣。

爭議並不源自作品的質量,而是這幅作品並不完全由畫師個人完成。遊戲設計師Jason Allen首先是透過AI繪圖工具Midjourney生成原畫,再經過Photoshop潤色,從而完成了這幅作品。

這並非AIGC(人工智慧內容生成)發展的孤例。就在月前,網際網路颳起了一陣ChatGPT風,起因是OpenAI釋出了一個全新的聊天機器人模型—— ChatGPT。和過去那些聊天機器人相比,ChatGPT不僅可以回答人類的追問,承認自己回答中的錯誤,拒絕回答不適當的問題,還能寫詩和程式設計。根據外媒報道,有人甚至讓ChatGPT為自己寫論文並獲得了及格。

連馬斯克都忍不住感嘆:“ChatGPT好得嚇人,我們離強大到危險的人工智慧不遠了。“

當藝術界開始因為“AI繪畫到底算不算藝術品”而吵得不可開交,當普羅大眾對ChatGPT的對話能力驚歎不已,AIGC本身值得期待的就不再只是驚人的迭代和學習能力,而是作為一個生產力和生產工具的結合體,在生成內容維度和智慧化程度上所展現的潛力。

破解元宇宙內容難題

一個公認的事實是,制約元宇宙相關產業發展的重要瓶頸,是內容生產上的不足。也許你會馬上反駁,最大的障礙難道不是技術的不成熟嗎?確實,當下無論是VR還是AR,互動技術和光學技術都無法達到大多數人對元宇宙期望的那樣。

但元宇宙相關產業的落地和發展並不完全依賴於這些硬體,無論是數字人還是元宇宙第一股Roblox都足以證明。

元宇宙當前最大的挑戰反而是在內容側,如何提供能夠滿足各行各業需求的高質量內容?

以數字人為例,”擬人化“和”自動化“是判斷一個數字人等級的標準。在這個標準下,數字人被分為了L1-L5五個等級。其中L4級別的數字人能夠實現部分智慧化互動;L5級則能夠實現完全智慧化互動。從L4級別開始,數字人能夠逐漸替代真人去完成服務。

(來源:商湯智慧產業研究院)

這也意味著,數字人產業的突破,和L4及以上級別的數字人能否量產息息相關。但一般一個數字人的生成需要經過模型重建、動畫準備等多個過程,製作流程長達數月,這種生產力上的不足也嚴重製約了數字人的普及。

AIGC正在成為打破這道瓶頸的關鍵。

從2016年創造SenseMARS平臺時,AI龍頭商湯科技就開始從全景智慧的角度佈局AIGC各種能力。

到目前為止,商湯不僅在計算機視覺方面積累了超過49000個演算法模型,覆蓋從視覺訊號的分析理解到實現數字內容的生成等各方面;也自研並具備了包括語音識別(ASR)、語義理解(NLP知識圖譜)、語音合成(TTS)以及語音動畫合成(STA)等多項技術能力。

透過這些底層AI技術的迭代,商湯幾乎重塑了數字人的整個生產流程。

(來源:商湯智慧產業研究院)

在傳統 CG 建模環節裡,商湯推出的智慧化生成引擎可以基於少量照片的面部掃描,演算法自動生成高精度的3D 面部模型,大大減少了建模環節的投入和時間成本。

智慧化驅動引擎則透過STA等演算法加速協調數字人的擬人化程度,讓其整體動作表現更加自然,減輕了畫師的工作強度和人工成本。

而在決定數字人”自動化“的多模態互動和深度學習能力構建環節,智慧化互動引擎專注於提高數字人的智慧性。基於語音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術組合,結合商湯所積累的海量特定知識領域的知識問答庫,數字人不僅可以和使用者快速高效的建立對話關係,還能實現自身的深度學習和迭代升級。

同樣的例子在遊戲產業也有所體現。

遊戲是業內公認的元宇宙雛形之一,但當下遊戲產業發展的桎梏也很明顯,即內容創新。傳統開發存在明顯的智慧上限,這使得遊戲很難持續為玩家提供情緒價值。在此條件下,遊戲廠商們要麼持續投入大量資金做內容建設,要麼等待下一個天才策劃或者玩法的出現。

也因此,能夠快速、高質量產出內容的AIGC被視為了破局的關鍵。2021年商湯成立了智慧決策與遊戲事業部,推出了SenseMAP。這款集合了商湯深度學習、智慧決策等前沿的AI技術的產品幾乎涵蓋了遊戲開發的整個流程。

在遊戲生態上,SenseMAP不僅能夠透過真實玩家遊戲資料訓練NPC,讓其具備類似真實玩家的遊戲行為,還能讓其和普通玩家進行互動。

在內容生態上,SenseMAP支援角色設計、動作捕捉、人臉3D生成等多項功能,大大降低了角色的生產週期,滿足玩家的UGC需求。

隨著AIGC的發展和普及,過去那些耗費巨大的知識性和創造性工作的邊際成本將大幅降低,過去制約元宇宙相關產業發展的內容問題將迎刃而解,從而產生巨大的生產效率和經濟價值。

可以預見的是,AIGC正站在元宇宙的石門前,喊出了那聲“芝麻開門”。

AIGC何以被點燃?

AIGC的本質是內容與場景,需要AI與後端基建,也就是演算法、資料和算力共同生成。當下,AIGC正朝著更強、更快、更低成本的方向發展。

一方面,隨著AI模型的通用性不斷提高,AIGC應用的門檻在降低,效率卻在進一步提高。

2015年以前,小模型被公認為是AI模型的最優選。這是因為小型的模型對於硬體的要求較低,同時和大模型相比,小模型具有更高的可解釋性和穩健性。但小模型的缺點在於,對通用任務的處理表現並不好。換言之,他們很難針對特定領域或者場景去進行定製。

在這個背景下,大模型脫穎而出。大模型可泛化能力強,可以做到”舉一反三“,同一模型利用少量資料進行微調或不進行微調就能完成多個場景的任務,從而擺脫小模型應用碎片化、作坊式開發的特點。

這為AIGC進入新階段提供了契機。以商湯為例,剖析其技術基座,商湯元宇宙主要基於SenseMARS火星混合現實平臺打造,目前該平臺內含3,500個人工智慧模型,包括感知智慧、決策智慧、智慧內容生成(包括增強現實、混合現實)、軟體智慧體及其他基礎設施(如雲引擎等)。

基於SenseMARS,商湯能夠針對不同的行業拿出的方案,從而實現元宇宙相關產業的廣泛應用。前文提到的數字人就是典型案例。商湯打造的AI數字人不僅在逼真程度上媲美真人,而且更聰明,能夠”聽得懂,看得見,說得出“,很重要的原因在於商湯的AI數字人是由三種引擎(演算法)共同打造的。

另一方面,算力、演算法模型等後端基建相關的基礎設施建設加速了大模型的生產迭代,這為AIGC的廣泛應用打下了基礎。

爆火的ChatGPT能夠實現當前的互動,就離不開OpenAI在AI預訓練大模型領域的積累。從2018年起,OpenAI就開始釋出生成式預訓練語言模型GPT,可用於生成文章、程式碼、機器翻譯、問答等各類內容。

在這股預訓練大模型的風潮之下,是一場拼引數、拼算力的軍備競賽。2018年,GPT的引數量還只有1。17億。隨後幾年,OpenAI每一代GPT模型的引數量都爆炸式增長。到2020年5月,新發布的GPT-3引數量直接暴漲至1750億。

AI模型對算力的需求在過去短短几年內翻了大約100萬倍,平均每年十幾倍,這個增速甚至超過了對演算法精度增長的需求。

算力即最核心的生產力。如何把握住驅動AIGC的根本源動力?商湯的人工智慧基礎設施SenseCore AI大裝置在更早時候已給出了答案。

資料顯示,SenseCore商湯AI大裝置的核心由計算基礎設施、模型層、深度學習層三個部分架構而成,分別對應算力、演算法模型生成和演算法模型訓練三個要素。

2022年,商湯在上海臨港的智算中心AIDC正式運營,是亞洲最大的人工智慧智慧計算中心之一。得益於磅礴算力的加持,模型層中的商湯的SenseSpring“模型工廠”能夠快速生成穩定可靠的模型,截至2022年6月,累計生產近50000個商用人工智慧模型。

ChatGPT本質上是基於NLP大模型落地的應用。而基於SenseCore,在視覺大模型領域,商湯已訓練和構建了超過300億量級模型引數超大基模型,得以有效支援AIGC的應用。

商湯2022年中報透露,公司在ImageNet大規模識別任務中實現超90%精度,和Google、微軟共同躋身世界前三。

在SenseCore的助力下,演算法模型在快速生成和迭代的同時,成本也在降低。

據商湯中報披露,基於大模型的自動資料生產線不僅將資料自動標註速度提升到了傳統人工的600倍,成本也降到了過去人工的1/500,且標註精度與人工水平一致。

透過SenseCore商湯AI大裝置強大的算力基礎和領先的演算法能力,商湯能夠以高效、自動化、集約化的方式,讓高質量的AI演算法實現“量產”,從而進一步拓展AIGC的應用範圍。

毋庸置疑,屬於元宇宙的黃金時代已經初見端倪。

元宇宙未來已來

儘管《頭號玩家》那樣的元宇宙看起來離我們還很遙遠,但是元宇宙和我們生活的聯絡遠比我們想象的要緊密。

在廣州悅匯城週年慶的現場,越秀地產聯合商湯推出AR Show,遊客們可以看到冰龍在上空盤旋,夢幻逼真的冰雪城堡,還有從天而降的紅包雨等。

這無疑為顧客提供了一種全新的互動方式,也重新定義了”商業空間“的概念。在悅匯城週年慶活動期間,AR Show助力廣州悅匯城全場銷售額同比增長196%,客流增長超過開業同期。

一些我們熟悉的服務場景也在元宇宙的加持下發生了變化。寧波銀行上海分行就有一位特殊的大堂客服經理——商湯科技基於”AI數字人服務中臺“為寧波銀行專屬打造的數字人員工小寧。

據瞭解,小寧不僅可以對前來辦理業務的顧客給予主動問候和自動接待,並透過專業、自然的交流互動,提供各類業務諮詢和問題回覆,還能針對客戶需求進行自動化引導和智慧分流。

日前,小寧“首次亮相直播平臺,這也是商湯科技AI數字人”虛擬IP在線上營銷場景中的首次應用。

事實上,元宇宙相關產業的商業化路徑正逐漸清晰,早早佈局的商湯憑藉先發優勢顯露頭角。

在線上元宇宙方面,商湯已實現軟體向SaaS模式的升級,連續6年實現市場份額增長,市場份額蟬聯第一。

商湯生產的互動式AI數字人,在文旅、展館、金融、教育、商超等實體產業中廣泛應用。與此同時,商湯在2022年與敦煌文創、徐悲鴻美術館等合作生成頂級IP數字文創產品,併發行超2萬個限量版數字藏品。

商湯同步深度佈局線下元宇宙場景,以簽約運營的商業模式,落地了百餘個海內外元宇宙專案,累計生成超過一千萬平米線下場景。

僅商業零售元宇宙領域,商湯與中國電信合作賦能400多家商業綜合體。在北京富力廣場、上海虹口凱德mall、武漢永珍城、鄭州正弘城,商湯的商業空間元宇宙應用正在為線下商業帶來新的突破點和增長點。

更直觀的表現則是,商湯2022年中報顯示,包含元宇宙業務的智慧生活板塊上半年營收同比增長98%,佔總收入的21%。

Gartner預測稱,到2026年,全球30%的企業機構將擁有用於數字人和元宇宙的產品與服務。未來AIGC存在規模化變現的潛力。麥肯錫則預測,到2030年全球元宇宙相關支出或達5萬億美元。

在這場或許比移動網際網路更加顛覆的大變革裡,靠著佈局和技術的領先身位,商湯有望迎來新的增長曲線。

*文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯絡我們,本平臺將立即更正。