奧推網

選單
科技

AI作畫爆火背後,一半海水一半火焰

圖片來源@視覺中國

文 | 洞見新研社,作者 | 辰紋

“未來十年,AIGC(人工智慧自主生產內容)將顛覆現有內容生產模式。可以實現以十分之一的成本,以百倍千倍的生產速度,去生成AI原創內容。”

李彥宏7月在百度世界大會上的發言話音未落,AI作畫的風潮如同一場旋風,席捲了網際網路的每個角落,不光引發了社會各界的廣泛討論,而且開始從專業領域走進普通人的生活。

曾敗於AI的天才棋手柯潔、知名畫師烏合麒麟等都曾參與過相關討論,閒魚上甚至出現售賣AI繪畫作品的帖子,“1分鐘內出圖”,“5元4張”,主打一個低價高速。

而隨著像百度、華為這樣的科技巨頭以及資本的入場,更是將AI繪畫的熱度抬高了一個等級。

百度和華為分別推出了各自的AI繪畫平臺“文心一格”與ModelArts。

生成式AI平臺“TIAMAT”則在10月12日宣佈完成由知名風投機構DCM投資的數百萬美元天使輪融資。

在此之前,Stability AI獲得了1。01億美元種子輪融資,正式晉升獨角獸行列;幾乎同一時間,另一家人工智慧獨角獸公司Jasper也宣佈獲得了1。25億美元的新融資。

AI作畫爆火,展示了AIGC技術的突破進展,當然有值得高興的地方,可技術的進步與落地如何產生價值,進而引導相關行業完成生產力與生產關係的重建,卻仍有諸多疑問待解。

01 為什麼是AI作畫?

AI作畫並不是什麼新鮮事物,早在2012年就已經有所發展,只是AI繪畫的早期作品看起來還很粗糙,直到今年年初時,AI繪畫還只停留在“能看”的階段。

其實對比一下現階段的AI寫作、AI作曲、AI配音、AI唱歌等技術,可以發現這些活AI都能做,但與人類相比,存在明顯的差距,當時的AI繪畫大致也是這樣的水平。

大眾對AI繪畫觀感的轉變發生在今年8月,美國遊戲設計師Jason Allen用一張AI繪畫作品《太空歌劇院》,拿下了美國科羅拉多州博覽會美術競賽一等獎。

大賽評委對這副AI作品的評語是:即使它是AI生成的作品,也依舊配得上這樣的成績。

雖然這副作品在AI生成之後,設計師還進行了上千次的修改,花費了近80個小時才完成,但並不妨礙公眾對AI能力的重新認識:原來AI繪畫已經可以超越人類了!

《太空歌劇院》能獲得專業評委認可並獲獎,背後支撐技術的突破功不可沒。

在今年年初時,AI繪圖軟體Disco Diffuion解決了效率問題,可以在很短的時間內批次生產繪畫作品;

後續幾個月,經過DALL·E 2與MidJourney等AI繪畫平臺的相繼測試,AI已經可以生成符合大眾審美要求的人物形象;

到了7月份,Disco Diffuion成功解決了細節與效率的問題,AI繪畫的精度提升到藝術品級別,生產效率提升到秒級,創造所需的門檻也大大降低,普通電腦甚至手機也能適用。

AI繪畫最終引爆的導火索當屬Disco Diffuion的開源,此次開源開放的不僅僅是程式,還有訓練好的模型,這大大降低了AI繪畫創業的難度,同時也對技術的普及起到了極大的推動作用。

在技術之外,C端使用者的瘋狂追捧,也成為AI繪畫爆火的重要因素。

相比其他AIGC創造,AI繪畫的門檻更低,參與度更高。

最開始時,MidJourney、Disco diffusion、Stable Diffusion等AI繪圖平臺生產了大量AI繪畫作品,這些作品在推特、Facebook等社交媒體平臺釋出後,引發大量使用者圍觀,特別是當用戶輸入幾個關鍵詞,就能在十幾秒內生成一幅高質量的繪畫作品,極大刺激了使用者的參與熱情。

在中國,是由搖滾樂隊萬能青年旅店的MV作品《殺死那個石家莊人》在B站率先引爆的,這個MV的每個畫面都取自歌曲的歌詞,由Midjourney平臺生成。

在此之後,《七里香》《孤勇者》《加州旅館》《波西米亞狂想曲》等熱門歌曲都被UP主們用AI繪畫的作品作為MV的素材重新創作了一次。

對此,有專業人士評述,對於使用者而言,AI作畫讓原來沒有繪畫基礎的人,能夠享受到創作帶來的愉悅,對於一些專業畫師,則是一個很好的工具,能夠更有效率的完成作品。

B站上有個熱評,在一定程度上反應了C端使用者喜歡AI繪畫的原因:一是出概念、找靈感,二是當成P圖素材與手工結合。

01 為什麼是AI作畫?

那麼問題來了,AI繪畫能賺錢嗎?又該怎樣賺錢呢?

AI繪畫平臺們面對洶湧而至的C端需求,利用社交平臺的引流,推出類似於付費服務或者“會員制”的收費模式。

由於目前面向C端的AI繪畫平臺大多為輕量級的工具應用,能夠展現出來的玩法和內容場景都比較有限,同時C端使用者進入AI繪畫平臺,大多出於好奇嚐鮮的目的,當新鮮感過去之後,如果不是專業人員,很難再刺激使用者進行二次消費,因而當前這種純粹To C的商業模式的根基並不穩固。

但若圍繞AI繪畫在C端使用者中的社交屬性,以及AIGC本身所包含的內容社群屬性去挖掘,則仍有一個非常大的成長空間等待開拓,利用微信小程式,創造了日增5萬用戶的紀錄的AI繪畫平臺“盜夢師”團隊也認為這是一個機會,但“難度很大”。

資料來源:剁椒TMT/網路綜合  製圖:洞見新研社

事實上,AI繪畫平臺將更多的目光瞄向了B端市場。

五大時尚刊物之一《時尚芭莎》在36週年紀念刊特地邀約了幾位AI畫手,藉助AI繪畫工具完成了一幅東方美學與超現實主義相結合的畫作,這可視為AI繪畫在B端應用的一個典型。

《時尚芭莎》36週年紀念刊 @慄米桃創作

而在醫療、工業設計、動漫設計、遊戲製作、服裝設計等領域中,AI繪畫可以施展的空間就更大了。

比如,有一種心理諮詢療法叫繪畫藝術療法,有的病人很難用語言表達自己的心理狀態,諮詢師就會請他們繪畫,從畫中看出他們的心理狀態。

但不是每個病人都會畫畫,如果在其中應用到AI繪畫的能力,病人表述畫作的構思與關鍵詞,AI生成畫面後經病人確認,或可為心理諮詢療法提供更多的支援。

比如,網路小說與漫畫的聯創,通常情況下,小說的寫作速度會高於漫畫的繪製速度,但有了AI繪畫後,可以大膽想象直接將小說的內容生成漫畫圖片,此時不光提高內容生產速度,更是整個內容生態的重構。

再比如,在元宇宙的世界中,從元宇宙場景的建立,到個人自我角色在元宇宙中的內容創作,AI繪畫乃至AIGC都是不可或缺的一項能力,很多專業人士認為,AI繪畫乃至AIGC與元宇宙的結合是必然趨勢。

其實AI繪畫能夠落地哪些場景,行業都有共識,在技術之外,AI繪畫平臺之間競爭的焦點則在於成本。

針對B端市場,面向一個特定行業時,AI繪畫要對相關模型進行大量的專業訓練,其中需要花費高額模型訓練成本,當營收無法覆蓋研發支出時,其商業模式也就無法成立了。

特別是當AI繪畫或將取代專業畫師時,企業需要考慮的因素就更多了,兩者之間的成本差是一方面,更重要的是,企業會要求AI不但要便宜,還要比人類畫的更好,才會有動力和足夠的理由推動變革的進行。

02 一座待挖的金礦

回到中國市場,在行業內普遍由DALL-E 2和Stable Diffusion等國外模型唱主角的背景下,如何讓AI繪畫更好的表達中國元素成為一個不容忽視的問題。

為什麼要這麼說,我們先來看看一副AI繪畫作品是如何產生的。

在盜夢師小程式中輸入文字:

沐浴在晨光裡;山頂上有中國式建築;壯麗的、奇妙的;約翰·豪;山水;湖泊;雲;早晨;農田;王凌;神話;光效;夢;格雷格·魯特科夫斯基,虛擬引擎;詹姆斯·格尼;ArtStation

幾秒之後就能生成以下一副作品。

盜夢師小程式AI作品

很明顯,模型對中文語義與中國文化的理解非常重要,特別是在實際落地階段,模型如果不能理解具有中國特色的行業特點,那麼AI繪畫出的產品將很難適用行業及場景的需求。

對此,盜夢師雖然用的是Stable Diffusion模型,但對該模型進行了中國本土化的改造,用自己寫的follow instruction的方式對模型進行訓練,並且加入了大量本地化資料。

TIAMAT也認為,AI模型的訓練過程其實和小學生練習寫作的過程非常相似,不斷吸收優秀作品的寫作風格、修辭手法,才能最終創作出一篇高分作品,其中採用中國元素的資料資源進行訓練是極為關鍵的一環。

百度釋出的AI繪畫平臺文心ERNIE-ViLG 2。0中,則採用了知識增強演算法的混合降噪專家建模。

為了能夠準確理解使用者在使用AI繪畫應用時輸入文字的語義,特別是一些複雜描述,ERNIE-ViLG 2。0透過視覺、語言等多源知識指引擴散模型學習,強化文圖生成擴散模型對於語義的精確理解。

為了增強AI繪畫生成作品的精細度,ERNIE-ViLG 2。0又引入了基於時間步的混合降噪專家模型來提升模型建模能力,讓模型在不同的生成階段選擇不同的“降噪專家”網路,從而實現更加細緻的降噪任務建模,進而提升生成影象的質量。

眾所周知,要想提高AI作畫的能力,特別是對中文語義和中國文化的理解,就必須有大量的中文圖文資料對模型進行訓練,這是一個極其繁瑣與耗費時間與金錢的過程,如果沒有足夠多的市場需求,一般的AI繪畫平臺不會投入太多資源。

百度不同,它在搜尋、AI以及深度學習框架等業務的研發中已經積累了海量的中文圖文資料資源,這些資源可以隨時呼叫,同時也成為ERNIE-ViLG 2。0的核心競爭力,相比其他模型,ERNIE-ViLG 2。0在表達具有中國風意境的畫作中表現更為突出。

在某種程度上來說,AI作畫的技術突破雖然是由美國帶動的,但中國的跟進速度並不慢,演化到現在,AI繪畫並不是簡簡單單的市場開拓方面的商業競爭,更是關乎到自主掌控AI關鍵技術的競爭,而其中取勝的關鍵是技術研發過程中尋找市場的內生需求,透過因地制宜的本土化適配,做好細分市場和細分場景的落地。(本文首發鈦媒體APP)