楊淨 發自 凹非寺
量子位 | 公眾號 QbitAI
AI藝術家
DALL·E達利
,竟成梗圖之王?
這陣子,國內外社交網路上,都颳起了一陣
“達利”meme風
。
比如這個,
帶著14公斤魚的蜘蛛俠
,這不就是我的日常摸魚狀態嗎?
恐怖分子皮卡丘
,還是很可愛怎麼回事?
在Twitter上,有網友專門發起了
#DalleMeme
話題,同時Reddit上也已經開設了專欄weirddalle,目前已有9萬人關注、每天近千人實時線上。
有個賬號每天靠發“達利”meme圖,幾個月時間已經攢粉近百萬。
可以說,達利家族真的靠梗圖徹底出圈了。但就在大家玩得不亦樂乎的時候,達利的締造者OpenAI卻坐不住了:
改名!改名!改名!
這是怎麼回事?
梗圖之王,並非真DALL·E
原來,靠梗圖出圈的“達利”,並非真正的達利。
它叫做DALL·E Mini,達利迷你版,比正版多了個Mini,但兩者
完全沒有任何關係
。
據作者介紹,當時幾個志同道合的開發者,在達利的啟發下,在Hugging Face上搞了個mini版,結果還獲了獎。
主創之一
Boris Dayma
,在此基礎上繼續開發並將其開源。
免費的“達利”誰不用,要知道真正的DALL·E 2目前只有少部分內測資格~
於是乎,梗圖之王就此誕生。
據Wired報道,Hugging Face的CEO曾大吐苦水:我們的工程師第一天晚上都沒有睡覺。
要為這些模型提供大規模服務真的很困難。
而最近幾周,達利迷你版每天會提供大約50000張影象。甚至有媒體稱,已成網際網路上最受歡迎meme生成器。
作者透露,達利迷你版的設計結構很簡單。
核心兩個元件:語言模型+影象解碼器,它從網際網路上數百萬個
影象-文字標題對
學習而來。
語言模型使用的是BART,它並不直接處理文字,而是類似於序列到序列之間的建模。
以文字離散序列為輸入,輸出為影象的離散序列,然後用影象解碼器VQGAN生成影象。
△哥斯拉騎單輪車
OpenAI坐不住了:改名!
就在達利迷你版爆火全網之際,OpenAI坐不住了,要求原作者改名。
迫於壓力下,達利迷你版更名為了
Craiyon
,不過在Hugging Face上的介面名稱還沒有變。
不少網友表示:可以理解,這是一定會發生的事。但好的工具只會因為它的優點獲得認可,而非營銷噱頭。
與此同時,OpenAI這邊還在強調“為了與廣大觀眾分享DALL·E的魔力”,時不時地在部落格上釋出一些規避風險的舉措。
就在最近,他們在預訓練過程加了過濾器,刪除並重新加權了一些影象。
比如一些涉及軍事槍支、暴力和性的影象,都會在過濾之後消失。
這一波對比操作, 被不少網友調侃:
你們還在測試,達利迷你版那邊已經玩嗨了。
One More Thing
就在達利迷你版更名之際,又一個版本——min(DALL·E)誕生了,號稱是最小實現。
它已被剝離成基本要素,並轉換為 PyTorch,目前GitHub上已有上千星。
感興趣的旁友,可戳下方連結瞭解~
https://github。com/kuprel/min-dalle
Craiyon體驗連結
https://www。craiyon。com/
https://huggingface。co/spaces/dalle-mini/dalle-mini
參考連結:
[1]https://www。wired。com/story/dalle-ai-meme-machine/
[2]https://openai。com/blog/DALL·E-2-pre-training-mitigations/
[3]https://www。reddit。com/r/MachineLearning/comments/vmi13r/p_dalle_mini_stripped_to_its_bare_essentials_and/
[4]https://twitter。com/iScienceLuvr/status/1536294746041114624
[5]https://twitter。com/weirddalle
[6]https://www。reddit。com/r/weirddalle/
[7]https://www。reddit。com/r/dalle2/comments/vgtgdc/openai_who_runs_dalle2_alleged_threatened_creator/
— 完 —
量子位 QbitAI · 頭條號簽約