奧推網

選單
科技

最前線 | 助AI繪畫獨角獸Stability AI全球走紅,亞馬遜雲科技憑Amazon ...

日前,IDC釋出了《2022年亞太地區(不含日本)AI生命週期軟體工具和平臺供應商評估》報告,在其評估的供應商中,亞馬遜雲科技憑藉機器學習旗艦產品Amazon SageMaker的功能、交付能力以及在開源方面的優勢,被IDC列入“領導者”陣營,並居於圖中最高最遠位置。

IDC MarketScape評估模型透過綜合考量廠商在產品、服務、能力和策略等方面的表現能力及競爭力,對特定市場進行定量和定性評估。研究報告以清晰易讀的圖形進行總結,為行業使用者及IT廠商制定技術決策提供必要資訊。如上圖所示,報告中,亞馬遜雲科技在能力和戰略兩個維度都獲得最高分,在以圓圈為代表的市場份額方面,亞馬遜雲科技也位居前列。

亞馬遜雲科技參與評估的解決方案Amazon SageMaker可為客戶的資料準備、模型構建、訓練、評估、部署、MLOps和可信度提供端到端的完全託管服務,為企業的整個機器學習生命週期提供支援。IDC報告指出,憑藉在功能和產品、服務交付和增長方面的優勢,Amazon SageMaker成為亞馬遜雲科技增長最快的雲服務之一。

以AI繪畫走紅全球的新晉獨角獸公司Stability AI,去年推出了開源AI模型Stable Diffusion。藉助這一模型,任何人只需要提供一段文字描述,就有機會創作出任意風格的繪畫作品。Stable Diffusion自2022年8月推出以來,已經被全球超過20萬開發者下載和授權。Stability AI的消費級產品DreamStudio註冊使用者來自全球50多個國家,已經超過100萬,他們共同建立了超過1。7億張影象。

Stable Diffusion這樣的模型訓練起來非常困難,需要使用數千個GPU或Amazon Trainium機器學習訓練專用晶片。Stability AI 選擇亞馬遜雲科技作為首選雲提供商。透過使用 SageMaker 託管的基礎設施和最佳化庫,Stability AI能夠使其模型訓練具有更高韌性和效能。例如對於 GPT NeoX 等模型,Stability AI 使用 SageMaker 及其模型並行庫將訓練時間和成本減少 58%,同時,這些最佳化和效能改進適用於具有數百或數千億引數的模型。

Amazon SageMaker旨在打破機器學習的壁壘,推進前沿技術的普惠化,把機器學習能力真正從研究實驗室交到企業手中,亞馬遜雲科技在2017年 re:Invent 全球大會上首次推出。Amazon SageMaker由十幾種工具組成,包括SageMaker Data Wrangler、SageMaker Studio、SageMaker Autopilot、SageMaker Canvas和SageMaker Clarify等,並不斷根據客戶需求推出新的功能和特性。

亞馬遜雲科技近年來一直在Amazon SageMaker套件中快速推出新功能和特性。在過去的六年時間裡,亞馬遜雲科技為其增加了超過290項新的功能和特性,包括偵錯程式 (SageMaker Debugger)、模型監視器 (SageMaker Model Monitor)、剖析器(SageMaker Clarify)、AutoML (SageMaker Autopilot)、特徵商店(SageMaker Feature Store)、無程式碼功能 (SageMaker Canvas),以及第一個專門用於機器學習持續整合和持續交付(CI/CD)的工具,使機器學習在雲端和邊緣裝置上變得更為簡便,可擴充套件性更強。

這些功能和特性往往秉承開源特色,體現出強大的工程靈活性,支援快速交付和部署,可以有效支援使用者的規模化推理,具有良好的價效比,可以為使用者帶來資料引力和規模經濟等好處。

據此,IDC推薦具有構建者/開發者文化的企業、致力於以相對較小規模團隊或較低運營成本來擴充套件ML/DL模型的企業,以及重視技術支援質量和及時性的企業使用Amazon SageMaker。

過去,從事機器學習需要專門技能,通常由數量有限的開發人員、研究人員或以機器學習為主要業務的公司所有。開發人員和資料科學家必須首先將資料視覺化、轉換和預處理為演算法可用訓練模型的格式,涉及大量的算力、漫長的訓練週期,並需要設立專門的團隊來管理環境。這些環境通常跨越多個支援GPU的伺服器,以及需要大量的人工效能調整。

此外,在應用程式中部署經過訓練的模型需要一套不同的應用程式設計和處理分散式系統的專業技能。隨著資料集和變數的增加,新資訊的出現,舊模型變得不再可用,企業不得不重複上述過程。這導致除了資金充足的企業和研究機構外,大多數人都無法接觸到機器學習。

為此,Amazon SageMaker推出了全球首個用於機器學習的整合開發環境(IDE),使開發人員、資料科學家和商業分析師能夠快速、輕鬆地準備資料,並在規模上構建、訓練和部署高質量的機器學習模型,例如Amazon SageMaker Canvas為沒有機器學習經驗的商業分析師提供的無程式碼環境。Amazon SageMaker Studio Lab為學生提供無需設定、不收費的機器學習環境,讓他們能夠更快地學習機器學習技能。

最近,亞馬遜雲科技在2022 re:Invent全球大會上宣佈Amazon SageMaker 推出八項新功能,包括:新的 Amazon SageMaker 機器學習治理功能可以在整個機器學習生命週期中提供對模型效能的可見性;新的 Amazon SageMaker Studio Notebooks 功能提供了增強的Notebooks體驗,讓客戶只需點選幾下即可檢查和解決資料質量問題,促進資料科學團隊之間的實時協作,透過將Notebooks程式碼轉變到自動化作業加速機器學習實驗到生產的過程;Amazon SageMaker Geospatial ML 讓地理空間資料處理變得更容易等等。

此次釋出的新功能讓團隊能夠更輕鬆地協同機器學習模型的端到端開發和部署,將資料擴充套件到地理空間,幫助客戶大規模利用機器學習,並更好地進行機器學習相關的模型治理。

LG人工智慧研究院最近推出了由超大“人工智慧語言模型”EXAONE驅動的人工智慧藝術家Tilda。Tilda可以處理2。5億個高畫質影象-文字對資料集,並且透過多模態人工智慧創造全新的影象。Amazon SageMaker的擴充套件和分散式訓練能力,在開發EXAONE時發揮了至關重要的作用。訓練Tilda這樣的超大模型需要海量計算,高效的並行處理至關重要,此外,對大規模資料實現可持續管理,靈活處理新獲取的資料也是必要條件。LG人工智慧研究院透過使用Amazon SageMaker訓練模型和分散式訓練庫,在未對訓練程式碼進行重大修改的情況下,訓練模型的速度提高了59%。

香港職業教育學院的IT部門使用Amazon SageMaker Studio Lab為學生提供參與真實世界機器學習專案的機會,而不會被設定或配置所困住,從而能做更多的編碼練習。在基礎機器學習和Python相關的課程中使用Amazon SageMaker Studio Lab可以為學生在多項雲技術方面打下堅實基礎。