金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
AIGC
(AI生成內容)
,這個概念在今年可以說是火得一塌糊塗。
例如Stable Diffusion,只要對它說一句話,“唰唰唰”地就能秒生成畫作。
再如最近大火的ChatGPT,對答如流堪比人類,簡直讓網友們玩得不亦樂乎。
△左:Stable Diffusion作畫;右:ChatGPT作答
而就在這兩天,AIGC賽道可謂是又雙叒叕熱鬧了一把。
因為國內一家網際網路出海巨頭公司宣佈——正式入局AIGC。
而且不同於其它玩家的單一路線,它在進軍之際,直接是覆蓋四大細分領域:AI影象、AI音樂、AI文字和AI程式設計。
例如在
AI影象
這件事上,只需要在微信小程式裡輸入一句話便可秒生成一副作品,而且是中英混著來也hold得住的那種:
一隻貓咪eating noodle。
講真,不僅是在形象方面做到了逼真,就連小貓咪自帶的那種小心謹慎且不失可愛的勁兒也刻畫了出來。
不僅如此,它還能生成其他多種風格的圖片:
AI作曲
就更不在話下了,直接上作品欣賞:
在
AI文字
能力上,給出了一個上聯,它便可以秒懂其意給出一個對仗的下聯:
不僅如此,聊天、問答、中英互譯、內容續寫等能力也是不在話下。
再如
AI程式設計
,在VS Code上只需簡單安裝一個外掛,游標處按一下“Tab”鍵,一整段程式碼便可立即呈上:
“網際網路出海巨頭”加持、一口氣又釋出並開源幾大模型,這可以說是今年AIGC賽道值得關注的一件大事了。
這個玩家是誰?
不繞彎子,搞出如此大動作的玩家,正是
崑崙萬維
。
至於為什麼說“值得關注”,可以總結為兩點。
第一,就是有技術積累。
崑崙萬維實則早在2年前便已經組建了超過200人的團隊著手佈局AIGC,此次推出的 “崑崙天工”旗下模型包括天工巧繪SkyPaint、天工樂府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,已覆蓋影象、音樂、文字、程式設計等多模態內容生成能力。
除此之外,熟悉崑崙萬維的朋友都知道,它在2008年成立之初,其業務是以網頁遊戲為主,包括自研的《三國風雲》、《武俠風雲》、《千軍破》等等。
而後崑崙萬維選擇了一條進軍海外的道路,除了自研之外,還代理運營了《極品飛車:最高通輯2015》、《憤怒的小鳥2》、《皇室戰爭》等眾多風靡全球的遊戲。
但說到它的逐步壯大,還要歸功於業務和戰略的轉型,也就是從單一的遊戲平臺向網際網路出海企業升級。
2016年至今,崑崙萬維的業務已經形成了海外資訊分發及元宇宙平臺Opera、海外社交娛樂平臺StarX、全球移動遊戲平臺Ark Games、休閒娛樂平臺閒徠互娛、投資板塊等五大業務。
也正是在這種多元業務轉型的過程中,崑崙萬維在現今AIGC所涉及的技術範疇裡做到了“量的積累”。
正如我們剛才提到的,崑崙天工所涵蓋的內容劍指AIGC四大熱門領域,即影象、音樂、文字和程式設計。那麼具體到AIGC各細分領域,崑崙萬維所開源釋出的模型又處於什麼水平?
以崑崙天工AI影象能力為例,據瞭解,天工巧繪SkyPaint是一款多語言的Stable Diffusion分支模型。
換言之,是在保留了Stable Diffusion對英文文字“理解”能力的同時,增加了其對中文提示詞的輸入能力。
不僅如此,平行語料庫的量級達到了1。5億級別,包含經常能夠用到的中英語料,古詩詞中英語料,字幕語料,百科語料,圖片文字描述語料等語料庫的集合。
在訓練方面,則是採用了模型蒸餾方案和雙語對齊方案,在使用教師模型對學生模型蒸餾的同時輔以解碼器語言對齊任務輔助模型訓練。
在實驗效能結果上來看,也是優於目前已釋出支援多語言的AI影象模型:
AI音樂方面,天工樂府SkyMusic是國內第一款商用級作曲AI模型,該模型引入全域性資訊約束、和絃隱式表徵,和絃準確率達到92。5%,遠超目前行業最佳64。7%;支援中文、英文、日文、韓文、法文等31種語種,支援從旋律生成歌詞、文案素材生成歌詞,且支援全球多曲風。
值得一提的是,天工樂府生成的20首AI音樂已經在美國、韓國、印尼等國家及全球180多個音影片平臺釋出。
崑崙天工在AI文字生成領域是基於千億量級的資料集訓練,最終構建的140億引數GPT-3生成模型天工妙筆SkyText。
這個模型的一大特點便是涵蓋眾多細分任務,包括續寫、對話、中英翻譯、內容風格生成、推理和詩詞對聯等等。
不僅如此,從實驗效能結果上來看,也是優於目前已開源的GPT中文預訓練大模型:
在
AI程式設計
領域,崑崙天工所提供的則是一款多語言開源程式設計大模型。
它支援目前眾多主流的程式語言,包括Java、JavaScript、C、C++、Python、Go和Shell等。
在其“嵌入”到VS Code中後,便可以實現程式碼續寫,還是給它“喂”一句中文註釋即可的那種。
而在AI程式設計中,模型的生成透過率可以說是非常重要的效能衡量指標之一,而崑崙天工在實驗效能結果上依舊錶現不俗:
由此可見,崑崙萬維在AIGC上的佈局並不是一蹴而就的事情,而是在長期發展過程中技術積累後的一種量變。
而“值得關注”的第二點,亦是歸於崑崙萬維自身——資金實力。
畢竟搞AIGC這件事,單是前期研發投入便需要砸入一大筆資金,並不是小玩家就能“玩得動”的事情。
這一點,從近期披露的財務資料中便可窺知一二。
據崑崙萬維釋出的2022年半年度業績來看,單是上半年這六個月,公司便已經實現了22。5億元的營業收入,整體毛利率水平進一步提高,達到79%。
若是將時間節點拉得更長一些,隨著崑崙萬維拓展多元業務,並且將人工智慧技術不斷注入其中,使其各細分業務也產生了較大的變化。
例如Opera瀏覽器,便從傳統瀏覽器成功向科技驅動的資訊分發與元宇宙平臺轉型,由此帶來的營收變化也是肉眼可見。
單是今年上半年,Opera實現營業收入1。5億美元,同比增長34%,實現經調整後EBITDA 2392萬美元,同比增長572%。
截至2022年第三季度,Opera News及元宇宙等新興業務商業化能力不斷提升。其中,雲遊戲社群GX。Games上線遊戲突破2000款,Opera GX月活躍使用者超1800萬,Opera全球平均月活躍使用者達3。21億。
再如旗下的海外社交娛樂平臺StarX,全球註冊使用者數已超過2。8億,營收保持強勁增長。Ark Games主打自研的MMORPG新品《聖境之塔》,目前單月最高流水收入已經突破300萬美元。
除此之外,崑崙萬維在投資領域也斬獲頗多。比如最近剛上市的全球最大LGBTQ社交平臺Grindr,背後大股東就曾經是崑崙萬維,光是這一筆投資就讓崑崙萬維的收益超過33億元。
而這一次開源AIGC模型,也是其不斷加碼科技研發投入的必然結果。
例如在AI影象上,崑崙萬維所採用的便是市面上算力最高的顯示卡叢集A100
(80G版本)
,可提供超快速的視訊記憶體頻寬,每秒超過 2 萬億位元組,處理超大型模型和資料集。
AI繪畫團隊對模型訓練時間超過了9萬個顯示卡小時,其研發訓練所砸的成本可見一斑;不僅如此,在AI文字生成方面,也是透過A100 GPU叢集訓練得到的最終模型。
據團隊透露,崑崙萬維自2020年開始佈局AIGC開始,便已經投入了數千萬元的資金。
有技術積累,有資金研發,而且本身亦是網際網路出海巨頭,這便是崑崙萬維此番動作值得關注的原因了。
而從另一角度來看,崑崙萬維的入局也未嘗不是對AIGC賽道的一種認可。
因為有實力的玩家們,確實都在邁步於此。
火爆的AIGC賽道
近期AI圈新貴ChatGPT背後的OpenAI,便是AIGC玩家中非常典型的一位。
ChatGPT相當於此前OpenAI提出的GPT的3。5版本,問世5天使用者量便達到了100萬之多。
而更早一點的Stable Diffusion,也是在僅釋出一個月的時間內,其背後的公司便被估值到了69億元。
這種火爆,未來的市場規模和前景也已經有了推測:
到2030年,AIGC市場規模或將超過萬億人民幣。
除了二者之外,國外邁進AIGC領域的巨頭玩家不勝列舉,例如谷歌、Meta、英偉達等等,均已將這個賽道視為重點。
而縱觀這些玩家的特點,除去擁有充足的研發資金外,還包括有技術、有生態、有落地場景。
反觀國內的發展,目前可以說是尚未進入真正的AIGC階段,這一點在量子位智庫的《AIGC/AI生成內容產業展望報告》中有所提及。
雖然在細分賽道上出現了個別優秀的先行公司及研究機構,但目前行業尚未進入大規模驗證和體系化發展的階段。
例如在場景上來看,目前最關鍵的是內容領域需求較為飽和,且降本增效尚不夠迫切。細分來看,虛擬人行業將成為產業中短期增長的關鍵動力。玩家需要尋找容錯率較高、專業度或創意要求有限的場景。
但長期而言,AIGC依舊需要有需求更加清晰且明確的消費落地場景,例如實時性場景
(如實時互動、實時反饋類場景)
和高度個性化生成場景。
再如玩家方面,國內目前的初創玩家數量較少,大部分細分賽道的初創玩家在5家以下,大部分為具有相關業務大廠/研究機構的內部探索專案。
因為市場規模短期內相對有限,且渠道和前期資源的積累需要較長時間,我們認為後期會更容易出現高行業集中度。
技術方面,除去個別佈局較早的企業外,國內AIGC領域大規模穩定生產的能力還需進一步增強,完成從嚐鮮式做法向正式和業務化的進入各類場景的轉化。
據業內人士估計,預計2-3年內,各AIGC能力有望在成本可控的前提下,實現工業化生產。
最後是在變現方面,儘管國內的Game AI、虛擬人、TTS、結構化文字寫作等領域已形成穩定的業務合作關係及收入關係,但行業整體的變現能力仍待進一步證明。且基本為專案制/長期專案制,標準化/平臺化產品欠缺發育。
因此,種種分析下來,對於國內AIGC的發展現狀,我們可以認為仍舊處於一種嘗試階段,大部分情況下AIGC尚未進入業務場景,變現能力有待增長。
那麼接下來需要討論的一個問題便是:崑崙萬維的入局又會帶來怎樣的改變?
從技術和研發資金等方面來看,正如我們剛才提到的,崑崙萬維是具備踏入AIGC門檻的資格。
而從此次開源併發布四大模型來看,崑崙萬維要做的重點更是在於推動生態的發展建設,不僅僅是純做應用那麼簡單,而是從模型層上出發掌握更多主動權。
首先是從崑崙萬維自身維度來看,其在全球平均月活躍使用者近4億,並且已然涉獵的多元業務覆蓋AIGC多個重要場景。
這樣正是符合國外巨頭玩家們“有生態”、“有落地場景”的特點。
不僅如此,對於國內AIGC現階段最為難解的變現問題,崑崙萬維也發表了它的觀點:
模型開源後不收費,但可以透過如Mango DB 、Databricks的方法,在商業支援、雲服務方面去收費,形成收入來源。
我們的對標公司是Databricks、MongoDB和正在成功的 Stability AI,這些公司在資本市場的市值也不低。
我們堅信開源的迭代速度遠遠超過閉源,終極目的是讓開源雲專案起到大廠Saas的補充,給中小企業、中小開發者、普通開發者更好的選擇。
那麼對於國內AIGC新晉巨頭玩家的這套“打法”,你有什麼看法呢?
— 完 —
量子位 QbitAI · 頭條號簽約