奧推網

選單
科技

快速生成超寫實數字人,「大觥科技」助力元宇宙應用場景落地 | 早期專案

文 | 周鑫雨

編輯 | 蘇建勳

作為人類在元宇宙中的主要生命形式,數字人已經成為達成元宇宙應用場景落地的關鍵命題。

Research and Markets研究顯示,全球虛擬活動市場規模將超過3。2萬億人民幣,同時IDC最新發布的報告也顯示,中國虛擬數字人市場規模也呈現出高速增長的趨勢,預計到2026年規模將達102。4億元。

今年,AI演算法公司「大觥科技」抓住虛擬數字人的風口,開展虛擬數字人業務,以實現數字人的快速生成、快速驅動和多樣化交付。在此之前,成立於2018年的大觥科技從影像處理AI演算法發軔——針對B端客戶,大觥科技為專業影視機構提供專業級影像修復及增強服務。針對C端客戶,大觥科技透過“Silimini”和“你我當年”等移動端App提供專業級的影象及影像修復、增強服務。

在這一過程中,大觥科技逐步深化AI技術優勢,打磨出一套針對手機使用者的高效3D建模演算法。為了解決傳統手工建模和相機陣列等技術生成周期長、費用高、環境限制大等痛點,大觥科技的數字人生成方案採用手機攝像頭動態取樣技術,透過演算法生成3D超寫實數字人。

大觥科技將生成數字人的時間由傳統方式的幾周到幾個月壓縮至 1 分鐘以下。此外,相較於手工建模和相機陣列等技術,大觥科技提供的技術方案優勢在於生成速度快、通用性強、還原程度高,由於使用了工業級的佈線、繫結及檔案標準,使得大觥生成的數字人可在多個場景和平臺快速使用及匯出。

藉助自主開發的元宇宙社交與娛樂App Metata,大觥科技對快速生成虛擬數字人的應用場景進行了實驗。使用者只需用手機前置攝像頭錄製一段影片,就能高效生成與自己還原度高度一致的超寫實數字人。

大觥科技數字人生成方案。圖源:受訪者供圖

大觥科技數字人生成方案。圖源:受訪者供圖

同時,大觥科技還提供了基於手機及攝像頭的數字人快速驅動方案,該方案對裝置和環境的要求較低,支援手機實時或離線驅動。此外,大觥科技數字人生成的 API 在同類企業中具有價格優勢,採取根據呼叫量階梯定價的策略,價格位於百元檔。

目前,大觥科技的業務發力點在B端。透過建立全套數字人交付技術棧,大觥科技的交付技術棧集成了3D引擎重建、面部表情及肢體動作驅動、TTS/NLP能力整合、人機互動引擎、環境場景生成等服務場景,並根據服務的不同採用獨立應用、API服務、遊戲服務、線上平臺、大客戶定製等交付形式。

今年10月中旬,大觥科技計劃對外推出生成3D寫實數字人的技術Demo。在未來,藉助自研的一鍵式AI能力呼叫服務平臺“大觥AI開放平臺”,大觥科技計劃在數字人生成的風格多樣性上發力,並透過加入虛擬服裝等數字資產,為使用者提供更多的應用場景。

大觥科技CEO黃碩曾在螞蟻金服任人工智慧部高階總監、資深產品專家等要職。CTO兼首席科學家李昊在計算機視覺、人工智慧深度學習、計算機圖形學等技術領域有多年經驗。目前公司有約50名員工,近70%的人員負責演算法和研發。

36kr製圖