奧推網

選單
科技

阿里底層自研技術大爆發!推龍蜥作業系統、第四代神龍架構,AI大模型...

智東西(公眾號:zhidxcom)

作者 | 李水青

編輯 | 心緣

智東西10月20日訊息,在今年“元宇宙”、機器人等五花八門應用薈萃的阿里雲棲大會上,阿里雲照例帶來一場關於底層技術創新的盛宴。

今天上午在杭州雲棲小鎮主會場,阿里宣佈推出飛天雲作業系統新一代虛擬化技術第四代神龍架構,釋出全新作業系統“龍蜥”並宣佈開源,同時,推出宣佈自研雲原生關係型資料庫PolarDB重磅升級,實現記憶體池化、多主架構、HTAP實時分析等創新功能。

此外,阿里還推出大資料+AI一體化平臺“阿里靈傑”,這一平臺已支援達摩院多模態大模型M6已升級至全球首個突破10萬億引數的AI模型,規模超越此前谷歌釋出的1。6萬億Switch Transformer模型。

在“雙碳”背景下,阿里雲也更重視科技減碳。阿里巴巴集團副總裁、阿里雲智慧基礎設施事業部總經理周明宣佈,阿里雲將加速在新型資料中心內清潔能源的使用,位於河源的資料中心最快明年將100%使用清潔能源。

一、釋出並開源龍蜥作業系統,投入20億

會上,阿里巴巴集團副總裁、阿里雲智慧基礎產品事業部負責人蔣江偉帶來《永不止步的雲上創新》演講,宣佈釋出並開源全新“龍蜥”作業系統、飛天雲作業系統新一代虛擬化技術第四代神龍架構,同時,阿里達摩院作業系統實驗室也宣告成立。

據蔣江偉解讀,龍蜥作業系統定位於伺服器端,支援X86、ARM等多種晶片架構和計算場景,在阿里巴巴打磨十年且有效支撐了歷年天貓雙11。據稱龍蜥針對雲原生應用開發做了多重最佳化,為雲上典型場景帶來40%的綜合性能提升,故障率降低50%,相容CentOS生態,支援一鍵遷移並提供全棧國密能力。

蔣江偉宣佈,龍蜥作業系統完全開源,透過開源社群和作業系統廠商等形式提供服務。未來,阿里雲計劃為龍蜥投入20億專項資金,並聯合100家生態合作伙伴推動生態建設,提供至少十年技術支援。

一、釋出並開源龍蜥作業系統,投入20億

除了龍蜥作業系統,阿里雲還帶來了飛天雲作業系統新一代虛擬化技術,第四代神龍架構。

飛天是阿里雲在2009年推出的自研超大規模通用計算作業系統,可以將遍佈全球的百萬級伺服器連成一臺超級計算機,以線上公共服務的方式為客戶提供計算能力,多年來不斷迭代,成為阿里支援國家新型基礎設施建設戰略的一大底座。

蔣江偉指出,第四代神龍架構最大特徵就是對IO進行了加強。透過晶片加速IO引擎,不用改程式碼實現效能最佳化。舉個例子,阿里有一家供應商,提供供應鏈系統,前兩年為了最佳化效能,需要3-6個月時間做分散式架構改造。現在基於神龍架構4。0,能夠不修改程式碼直接升級。

作為飛天作業系統新一代虛擬化技術,除了IO加速,第四代神龍架構還在晶片級安全、雲原生彈性和高速網路領域做出最佳化,將雲計算首次帶進5微秒時延時代。

尤其在高速網路方面,據稱,第四代神龍架構首次搭載全球唯一的大規模彈性RDMA加速網路,網路延遲整體降低80%以上。蔣江偉公佈了一組測試,可以看到,在Nginx SSL場景下,第四代神龍架構比前代效能最高提升40%,在指定規格的虛擬場景下,eRDMA對比TCP效能最高提升30%。

此外,據稱在深度學習場景下,第四代神龍可提升分散式NLP和視覺計算30%的訓練效能;在大資料場景下,可提升Spark30%的計算效能;在資料庫場景下,MySQL效能最高提升60%、Redis混合讀寫吞吐量可提升130%;NginxSSL建連每秒吞吐效能提升420%。

二、飛天雲作業系統更新,推出第四代神龍架構

阿里巴巴集團副總裁、阿里雲智慧基礎設施事業部總經理周明帶來了關於數字基礎設施的新進展。

他談到,一提到資料中心大家聯想到的就是能耗,在“雙碳”政策下,數字基礎設施業務需要不斷創新,幫客戶實現快速迭代、降低成本、資源彈性。作為To B服務商,主要目的是為客戶做好服務,做深基礎。

怎麼做?

周明提出三個關鍵詞:1、穩定安全。2、資源創新。3、綠色環保。值得一提的是,在自研創新方面,阿里雲展示出了液冷資料中心、異構計算等多個創新點。有人可能會問,許多技術或器件都可以買來,為什麼要自研?對此,周明解釋,自研並非為了自控,而是為了解決一些實際問題,比如團隊2019年就開始使用自研交換機,就大大提高了聯網效率;比如傳統風冷難以解決散熱問題,阿里才自研液冷技術。

當下,科技減碳成為新型資料中心的關鍵詞。周明宣佈,阿里雲將加速在新型資料中心內清潔能源的使用,位於河源的資料中心最快明年將100%使用清潔能源。

同時,阿里雲在選址佈局上選擇張北、烏蘭察布資料中心,正是看中光能、風能及當地氣候適合自然風冷散熱,從而節省電能。此外,新技術如液冷技術融合AI應用,都加速了阿里雲綠色節能技術創新及迭代升級。

面向未來,周明認為有四大關鍵詞:算力中心化、雲端一體、雲原生、綠色節能。他說:“綠色是檢驗資料中心的黃金標準。”

二、飛天雲作業系統更新,推出第四代神龍架構

看完基礎設施及計算網路兩大底層技術更新,阿里雲智慧資料庫事業部總負責人李飛飛帶來了關於阿里雲資料庫的新技術釋出。

李飛飛宣佈了自研雲原生關係型資料庫PolarDB重磅升級,實現記憶體池化、多主架構、HTAP實時分析等創新功能,進一步引領雲原生資料庫技術的持續創新。據稱,PolarDB資料庫效能比MySQL高6倍,成本只有傳統商用資料庫的1/10。

李飛飛解讀,PolarDB實現了以下三項創新:

1、業內首次實現記憶體與計算、儲存的三層解耦,實現記憶體池化,使得彈效能力呈數量級提升,同時大幅度降低成本;

2、第二,上線多主架構,進一步提升可用性、併發處理、彈效能力,高效應對像“雙11”一樣的流量洪峰;

3、第三,成為真正的HTAP資料庫系統,可同時處理OLTP和OLAP型混合負載。

為了更好服務政企市場客戶,阿里雲同日還正式釋出重磅資料庫產品DBStack,可以非常敏捷地部署在客戶本地IDC或者IaaS平臺上,助力金融、政務、運營商、交通等行業客戶替換傳統商業資料庫,加速上雲。

此外,在人才培養方面,阿里雲還正式釋出阿里雲資料庫ACP認證,包含關係型資料庫和資料倉庫兩個方向,透過系統化培訓與認證體系,培養更多資料庫專業人才。

三、科技減碳,有資料中心100%使用清潔能源

會上,阿里巴巴集團副總裁、阿里雲計算平臺事業部負責人賈揚清還帶來了“阿里靈傑”,整合阿里整體大資料+AI能力對外開放,讓企業及開發者可“開箱即用”,能更專注於應用開發,能普惠化、外掛式的業務交付。

據介紹,“阿里靈傑”包含機器學習平臺PAI、雲原生大資料計算服務MaxCompute、實時計算Flink版、大資料開發治理平臺DataWorks、實時數倉 Hologres等產品,可調動規模高達10萬臺以上計算叢集,擁有云邊端一體的高效能訓練和推理引擎,能提供毫秒級延遲的實時資料分析能力等,是中國最大的大資料+AI一體化平臺。

賈揚清透露,基於“阿里靈傑”的分散式訓練最佳化技術,達摩院多模態大模型M6已升級至全球首個突破10萬億引數的AI模型,規模超越此前谷歌釋出的1。6萬億Switch Transformer模型。

此外,賈揚清還首次提出了大資料+AI一體化平臺的“4S”標準,即大模型(Scale)、高效率(Speed)、易用性(Simplicity)、場景化(Scenario),為人工智慧行業發展提供借鑑。

三、科技減碳,有資料中心100%使用清潔能源

近年來,阿里雲飛天作業系統快速迭代,從去年4月推出專有云支援企業客戶在自己的資料中心部署,到今年5月宣佈全面相容X86、ARM、RISC-V等多種晶片架構,實現“一雲多芯”,如今阿里雲飛天作業系統又在技術架構上實現新迭代。更值得一提的是,阿里雲推出全新作業系統“龍蜥”,並計劃投入20億專項資金,有望為雲原生應用開發帶來新的體驗。

當下,隨著政企數字化轉型步伐加快,不僅對資料儲存與處理安全、效率的需求變強,對於綠色減碳的要求也在變高,這也催促像阿里雲這樣的基礎設施服務商不斷進行技術創新迭代。