奧推網

選單
科技

大廠入局、遍地開花:“AI繪畫熱”卷出AIGC新賽道?

AIGC產業在近一段時間來引起了使用者們的廣泛關注,一方面,AI繪畫熱潮的興起將這一概念捧上了檯面,另一方面,AIGC產業的興起也呼應了在網際網路圈裡“打得火熱”的元宇宙概念。那麼,如何解讀AI繪畫、AIGC的商業前景與目前發展?不如來看看作者的解讀。

“試了一千遍,終於成功馴服AI。”近日,從朋友圈到小紅書到抖音的各大平臺上,都掀起一陣AI繪畫的熱潮。免費體驗、生成速度快,這些優點一定程度上彌補了AI出圖質量層次不齊的弊端,反而帶來了“開盲盒”的新鮮感。

從AI畫作《太空歌劇院》獲獎開始,AI繪畫不斷獲取新的關注,但在大眾視野內都沒有激起什麼浪花。今年8月,Stability AI方在GitHub上開源了Stable Diffusion模型的所有程式碼,一時間引起各方二創二改,AIGC產業迎來了一輪新的“春天”。

一、技術基礎

AIGC,全稱為AI Generated Content,即一種基於人工智慧技術自動生成內容的新型生產正規化。繼 PGC(專業生產內容)、UGC(使用者生成內容)之後,AIGC成為生產方式新的趨向與潮流。目前網際網路體系及技術尚不足AIGC全面應用,因此當下AIGC多用於輔助人工生產內容,作為PGC、UGC有益的補充。AI繪畫,就是AIGC的一個分支。

AIGC並非新鮮的概念。早在20世紀50年代,就出現了AIGC的小範圍實驗;19世紀末20世紀初則逐步向實用性、落地性過渡。隨後,相關技術與模型迅速發展,推出了從音訊到圖片、影片等多領域多模態的AIGC產品。

AIGC的迅猛發展,首先得益於深度學習技術模型的突破。2014年,業內提出GAN生成對抗網路演算法模型,透過AI內部生成、判別兩套模型進行迭代訓練,從而根據輸入的資訊生成新影象。GAN學習模型具有一定突破性,主要利用既有圖片進行“縫合、遷移”,但生成圖片可控性弱,彼時仍停留在較為生硬的AI風格。

隨後,AI作圖界陸續出現了DALL-E、CLIP、Disco Diffusion、Midjourney、DALL-E2、Stable Diffusion等模型,不斷完善文字轉影象模型,也逐步產生了提升圖片原創度、藝術性、渲染速度;帶來一陣AI繪畫質量的飛躍。網友紛紛感慨幾個月前還在嘲笑AI出圖模式化,如今已經真假難辨了。

真正帶動AI繪畫狂潮的,還是Stable Diffusion模型的開源。Stability AI以“AI by the people, for the people”為理念,開源作圖模型Stable Diffusion後也立刻吸引了業內外人士。

Stability AI的開源帶來了英文環境AI模型的遍地開花,然而,在引入並國產化的過程中,也出現了高低語境國家文化差異的障礙。如果直接基於英文Stable Diffusion翻譯進行研發,在某些語境中AI的語義理解會產生較大的出入。

二、產業佈局

開源,開卷。尤其今年是AI繪畫的大火時段,大大小小的公司都湧入這個賽道。大廠陸續佈局,小公司和個體也紛紛參與到這場AI界的狂歡。

國外頂尖技術公司以Google、Facebook、Meta幾大巨頭為主,更兼有掌握Stable Diffusion模型的Stability AI、掌握DALL-E2模型的Open AI等幾家新興獨角獸企業。幾家公司在相關領域的迭代速度非常快。2017年,Google開源一個AI簡筆畫應用;同年Facebook釋出CAN創造性對抗網路模型。2021年,OpenAI又相繼釋出DALL-E模型、CLIP模型;而2022年界內更是爆發出各路新模型,整個賽道呈現高速增長的狀態。

國內網際網路大廠也相繼部署AIGC方向的業務板塊。從語音到數字人,從小冰詩集到AI繪畫,AI無疑成為了近年的“頂流”。

然而有些出人意料的是,比起深入研發,AI繪畫在國內最大型出圈卻是流量路線的快車道。

百度作為國內網際網路巨頭,近年深耕智慧雲發展,依託飛槳、文心大模型的技術基礎,推出首款AI作畫產品“文心一格”。騰訊基於自身使用者社群覆蓋度,推出QQ小世界AI畫匠,利用分享效應並製造部分話題點形成借力傳播。抖音作為主打短影片社交的公司也推出了AI繪畫特效,也算借熱度發揮進行了一波平臺外宣。總體而言,還是基於降低門檻、社交路線的策略。

與AI繪畫相關的微信公眾號、小程式近期不斷湧現。有大公司,小公司、個體研發也不罕見。9月,意間AI繪畫大火,也帶動中文AI繪圖界不斷迭代。中科聞歌旗下的翰墨丹青、觸手AI等在中文AI繪畫產品上都有不錯的使用者聲譽, 6pen、Draft、靈境AI等國內團隊研發的產品也收穫一眾訪問量。

使用者在選擇AI繪畫應用時,最注重的點首先是產品質量,即AI的語義理解、出圖質量,而這些指標直接關涉到演算法模型的最佳化程度。大廠和巨頭在模型最佳化上無疑佔據制高點;但開源專案也弱化了這一技術隔膜,直接促成了AI繪畫應用“遍地開花”的局面。

三、商業前景

AI繪畫無疑呼應了“元宇宙”這個近年最火的市場熱點。且不論是發展大方向還是泡沫,未來的元宇宙產業都為AIGC提供了精準的適配場景,並助力形成商業的閉環。舉例而言,數字人需要配套的智慧語音系統、皮套繪製、動態設計等,在AIGC相關技術相對成熟後,利用其可能達到事半功倍的效果。

作為視覺化的工具,AI繪畫在整個AIGC產業鏈中佔據重要的一環。迴應Web3。0提出的更多體系化需求,AIGC在多年的發展中基本涉及了各大領域,形成一套環環相扣的細分賽道。根據AI技術場景,功能上涵蓋了文字、音訊、影象、影片等多方位內容生成技術,也從傳媒、影視、教育、金融等多個領域切入帶來新生產力。

然而上述AIGC大有可為的前景更多都存在於“未來”。當下在對其佈局的同時,要警惕對AI繪畫過度吹捧形成的“泡沫”。AIGC喝彩聲一片,然而更多仍是“概念破圈”,對C端使用者來說可能只意味著“曇花一現”的網紅體驗品。國內的模型訓練與產業鏈尚不成熟,沒有非常“拿得出手”的競品,最出圈的反而是“AI翻車例項”這類流量型產品。

而國內的AI智慧產業多半圍繞實體經濟佈局,如阿里巴巴新零售、百度自動駕駛、華為AI晶片等;圍繞AI繪畫等模組保持關注但尚不深入。百度此次推出的“文心一格”AI繪畫產品,就增加了出圖在商業應用場景的預覽;表明大廠也在謀求AI繪圖從ToC端體驗到ToB端商業化的轉型。藉助這波流量與關注度,儘早圍繞實際商業環境與需求開展部署,才能在似真似幻的歡呼聲中走好下一步棋。

作者:肖奕佳

本文由人人都是產品經理合作媒體 @鏡象娛樂 授權釋出,未經許可,禁止轉載。

題圖來自 Unsplash,基於 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供資訊儲存空間服務。