奧推網

選單
科技

OpenAI向企業開放AI文字轉影象功能,按圖片生成數量收費

IT之家 11 月 4 日訊息,OpenAI 推出了公開測試版的 API,使其影象生成軟體 DALL-E 更廣泛地提供給企業。該 API 將使企業更容易將 DALL-E 的文字轉影象功能新增到他們的產品中,為開發者提供簡化的工具,以便按照他們的喜好整合和定製該軟體。

該 API 的一個早期使用案例是微軟的 Designer 應用程式

,該應用使用 DALL-E 為 Office 使用者生成影象。微軟是 OpenAI 的主要投資者之一,並在上個月釋出了該應用程式。

OpenAI 負責 API 的產品經理 Luke Miller 稱:“我們已經有一些客戶以非常有趣的方式在此基礎上進行開發。有些是創造性的探索,有些是更多的商業導向。一家名為 Mixtiles 的初創公司正在使用該 API 生成用於家庭裝飾的海報和藝術品,另一家名為 CALA 的公司正在使用它來幫助客戶設計他們自己的服裝。”

在過去的一年裡,

人們對文字轉影象人工智慧的興趣和採用呈爆炸式增長

,而 OpenAI 雖然曾經是該領域的領導者,但現在受到了 Midjourney 和 Stability AI 等後來者的挑戰,並且他們對使用者的限制較少,允許使用者在幾乎沒有監督的情況下建立自己的 AI 系統。同時,這一領域的其它參與者,如谷歌和 Meta,採取了更為謹慎的方法:開發具有類似能力的系統,但將其公開使用限制在非常有限的場景中。

文字轉影象人工智雖然能提供的明顯的創造性好處,

但也存在多方面的問題

。該軟體可以被用來產生錯誤的資訊和有害的影象,並且在資料使用方面存在著具有挑戰性的道德問題。

像 DALL-E 這樣的文字-影象人工智慧系統是根據從網路上搜羅的影象進行訓練的,這些影象通常包括攝影師、藝術家和設計師的版權作品。許多藝術家感到憤怒的是,由此產生的技術不僅可以用來模仿他們的個人風格,

而且他們也沒有因為使用他們的作品為 OpenAI 這樣價值數十億美元的公司創造收入而得到補償。

IT之家瞭解到,一些開發文字轉影象應用的公司開始提供補償。例如 Shutterstock,他們將其貢獻者的資料授權給 OpenAI 以建立 DALL-E,並使用其 API 生成定製的庫存影象,最近該公司宣佈正在設立一個貢獻者基金,以補償其作品被用於訓練 AI 的個人。

當被問及 OpenAI 是否計劃制定任何類似的計劃來補償藝術家時,Miller 說現在沒有任何具體的東西可以分享,會繼續從社群尋求反饋,並稱這是一個非常複雜的問題,需要從很多不同的角度來考慮。

對於 OpenAI 來說,這個問題確實難以回答,因為該公司從未分享過用於建立 DALL-E 的訓練資料。法律專家稱,在美國,透過刮取公共圖片,即使是受版權保護的圖片,來訓練人工智慧模型可能會被合理使用原則所涵蓋。但許多藝術家指出,充分的法律保障並不等於道德上的認可。

OpenAI 說,對 DALL-E API 的訪問開始時將是有速率限制的,不會在客戶如何使用該技術方面進行審查。

客戶將按生成的影象數量收費

,並能在三個解析度級別中進行選擇:256 x 256 的影象每張 0。016 美元(約 0。1168 元人民幣);512 x 512 的影象每張 0。018 美元(約 0。1314 元人民幣);而 1024 x 1024 的影象每張 0。02 美元(約 0。146 元人民幣)。