奧推網

選單
科技

盜版DALL·E成梗圖之王?日產5萬張影象,擠爆抱抱臉伺服器

楊淨 發自 凹非寺

量子位 | 公眾號 QbitAI

AI藝術家

DALL·E達利

,竟成梗圖之王?

這陣子,國內外社交網路上,都颳起了一陣

“達利”meme風

比如這個,

帶著14公斤魚的蜘蛛俠

,這不就是我的日常摸魚狀態嗎?

恐怖分子皮卡丘

,還是很可愛怎麼回事?

在Twitter上,有網友專門發起了

#DalleMeme

話題,同時Reddit上也已經開設了專欄weirddalle,目前已有9萬人關注、每天近千人實時線上。

有個賬號每天靠發“達利”meme圖,幾個月時間已經攢粉近百萬。

可以說,達利家族真的靠梗圖徹底出圈了。但就在大家玩得不亦樂乎的時候,達利的締造者OpenAI卻坐不住了:

改名!改名!改名!

這是怎麼回事?

梗圖之王,並非真DALL·E

原來,靠梗圖出圈的“達利”,並非真正的達利。

它叫做DALL·E Mini,達利迷你版,比正版多了個Mini,但兩者

完全沒有任何關係

據作者介紹,當時幾個志同道合的開發者,在達利的啟發下,在Hugging Face上搞了個mini版,結果還獲了獎。

主創之一

Boris Dayma

,在此基礎上繼續開發並將其開源。

免費的“達利”誰不用,要知道真正的DALL·E 2目前只有少部分內測資格~

於是乎,梗圖之王就此誕生。

據Wired報道,Hugging Face的CEO曾大吐苦水:我們的工程師第一天晚上都沒有睡覺。

要為這些模型提供大規模服務真的很困難。

而最近幾周,達利迷你版每天會提供大約50000張影象。甚至有媒體稱,已成網際網路上最受歡迎meme生成器。

作者透露,達利迷你版的設計結構很簡單。

核心兩個元件:語言模型+影象解碼器,它從網際網路上數百萬個

影象-文字標題對

學習而來。

語言模型使用的是BART,它並不直接處理文字,而是類似於序列到序列之間的建模。

以文字離散序列為輸入,輸出為影象的離散序列,然後用影象解碼器VQGAN生成影象。

△哥斯拉騎單輪車

OpenAI坐不住了:改名!

就在達利迷你版爆火全網之際,OpenAI坐不住了,要求原作者改名。

迫於壓力下,達利迷你版更名為了

Craiyon

,不過在Hugging Face上的介面名稱還沒有變。

不少網友表示:可以理解,這是一定會發生的事。但好的工具只會因為它的優點獲得認可,而非營銷噱頭。

與此同時,OpenAI這邊還在強調“為了與廣大觀眾分享DALL·E的魔力”,時不時地在部落格上釋出一些規避風險的舉措。

就在最近,他們在預訓練過程加了過濾器,刪除並重新加權了一些影象。

比如一些涉及軍事槍支、暴力和性的影象,都會在過濾之後消失。

這一波對比操作, 被不少網友調侃:

你們還在測試,達利迷你版那邊已經玩嗨了。

One More Thing

就在達利迷你版更名之際,又一個版本——min(DALL·E)誕生了,號稱是最小實現。

它已被剝離成基本要素,並轉換為 PyTorch,目前GitHub上已有上千星。

感興趣的旁友,可戳下方連結瞭解~

https://github。com/kuprel/min-dalle

Craiyon體驗連結

https://www。craiyon。com/

https://huggingface。co/spaces/dalle-mini/dalle-mini

參考連結:

[1]https://www。wired。com/story/dalle-ai-meme-machine/

[2]https://openai。com/blog/DALL·E-2-pre-training-mitigations/

[3]https://www。reddit。com/r/MachineLearning/comments/vmi13r/p_dalle_mini_stripped_to_its_bare_essentials_and/

[4]https://twitter。com/iScienceLuvr/status/1536294746041114624

[5]https://twitter。com/weirddalle

[6]https://www。reddit。com/r/weirddalle/

[7]https://www。reddit。com/r/dalle2/comments/vgtgdc/openai_who_runs_dalle2_alleged_threatened_creator/

— 完 —

量子位 QbitAI · 頭條號簽約