奧推網

選單
科技

AI科學計算領域的再突破,升思MindSpore做"基石"的決心有多強?

過去的十多年,人工智慧技術越來越深刻地影響了人類社會,越來越多成熟的人工智慧產品逐漸滲透到每一個人的生活。就在大家享受著人工智慧帶來各種便利的同時,AI也不斷影響著最前沿的科學研究領域。過去的數百年來,實驗科學和理論科學一直是科學界的兩大基礎正規化。AI技術,特別是機器學習和強化學習方法,基於實驗或者計算產生的資料對所求解的問題進行可計算建模,從而得到複雜問題的有效解決方式,這對當今科學計算領域的研究正規化已經產生了巨大影響。

去年12月Science 公佈了該雜誌評選出的2021年十大“年度突破(2021 Breakthrough of the Year)”,其中排在首位的就是人工智慧(AI)在生命科學領域的應用——“Protein structures for all”。最為讓人矚目的非2021年7月15日由DeepMind團隊公佈的AlphaFold2莫屬,一個基於神經網路能夠預測蛋白質結構達到原子水平準確度的新模型。DeepMind在Nature發表的論文表示,已利用AlphaFold2預測了35萬種蛋白質結構,涵蓋了98。5%的人類蛋白質組,及其他20種生物幾乎完整的蛋白質組。這無疑向世人宣示了,人工智慧已然成為科學研究最重要的生產力之一。

而隨著科學研究、創新技術“卡脖子”的現象日趨嚴重,這一難題無時無刻不在提醒著國內科學研究者、開發者,我們需要有自己的科研軟體、AI基礎軟體,以保證中國在科學研究領域上不落後於人。2020年3月28日華為正式開源了全場景AI框架昇思MindSpore,到2022年3月27日全新的昇思MindSpore 1。6版本釋出。我們不但看到了昇思MindSpore越來越全面的功能、成熟的生態與強勁的效能,也能看到昇思依然堅持著“將科學計算與深度學習結合,將數值計算與深度學習相結合”的初心,為中國科研助力。

內外兼修,優勢並存的昇思MindSpore

隨著人工智慧在近年來的崛起,對應的AI框架也在不斷演化。從早期的torch、theano以及Caffe,奠定了基於Python、自動微分、計算圖等基本設計思路。到後面廣為人知的TensorFlow、PyTorch,透過分散式訓練、多樣的部署能力在工業界廣泛使用,另外一個是提供動態圖能力,在靈活性上吸引了大量的研究者和演算法工程師。而下一個階段AI框架的演化方向是什麼?似乎還沒有完全明確,我們可以看到業內一線大廠也在多條技術路中探索,其中包括TF2。0,JAX、MLIR、Swift for TF等,實現了動態圖和靜態圖的統一,構建統一的IR基礎設施,探索新的表達方式等。AI框架演化方向的多種多樣,讓業界看到了未來的無限可能。

昇思MindSpore開源以來,倍受廣大開發者的關注。作為新興AI框架,昇思MindSpore團隊根據科研工作者以及廣大開發者對AI框架使用的痛點,圍繞“全流程極簡,多套件打造極致開發體驗”、“全自動並行,最大釋放叢集算力”、“全場景協同,智慧匹配端、邊、雲多樣裝置”三專案標不斷進行技術演進。針對開發者訴求,昇思MindSpore與開發者開展了系統、深入的交流,不斷改進易用性,提升控制流效能並提供了多種開發工具。在最新的1。6版本中,釋出了高效易用的圖學習框架MindSpore Graph Learning、高效能可擴充套件的強化學習計算框架MindSpore Reinforcement、提供支援第三方框架模型遷移工具、讓使用者即時體驗的開發套件MindSpore Dev ToolKit、同時升級自定義運算元能力支援高效新增運算元,豐富MindSpore Quantum量子模組可支援使用者快速體驗量子計算的魅力,同時昇思還提升了框架的訓練與推理效能。

欣欣向榮的社群生態是開源專案的基石,為此我們能看到昇思對社群建設的認真態度。兩年後的今天,昇思MindSpore在碼雲(Gitee)千萬開源專案中活躍度排名第一,累計下載量超過142萬;服務於5000多家企業,涵蓋金融、製造、交通、能源、終端等端邊雲全場景行業;高校及科研機構基於昇思貢獻頂會論文300+;40+高校參與社群模型眾智活動,為昇思貢獻程式碼,目前已支援300+主流模型,支撐全場景AI應用。

昇思MindSpore透過架構創新,原生支援科學計算,突破了高階高維自動微分、自動異構並行、跨尺度計算融合等創新技術,構築了以八大套件為核心,可廣泛支援物理驅動/資料驅動等多種AI科學計算正規化的全場景框架。昇思MindSpore面向製造、氣象、製藥、航空航天、汽車、能源、金融、材料行業規劃了八大套件的開發。目前昇思在製造、氣象、製藥、航空航天領域的四大套件已經投入研發,其中AI電磁模擬MindSpore Elec和AI生物計算MindSpore SPONGE取得了驚人的成果。

以AI框架之助力,破科學研究之困局

多年來,科學領域的研究人員透過觀察和實驗不斷積累了大量資料。通常情況下,研究人員很難對海量的資料進行有效的分析以得出模型,再獲得重要參考依據。但人工智慧技術的出現,讓業界看到了打破這一困局的契機。北京大學的楊超教授曾表示:科學計算和超級計算之間相互促進、共同發展的閉環已經形成了幾十年,人工智慧的巨大成功為科學計算帶來了新思路、新方法、新工具,而科學計算的嚴謹體系則有助於提升現有人工智慧技術的可解釋性。將人工智慧引入更底層的科研領域,以處理多維、多模態的大量資料,將有助科學家突破長久以來的研究瓶頸。昇思MindSpore從創立之初就已經佈局科學計算領域,透過多尺度混合計算和高階混合微分兩大關鍵創新,將昇思原有的AI計算引擎升級為AI與科學計算的統一引擎,實現融合的統一加速。經過兩年的砥礪奮進,昇思MindSpore已經在多個科學領域有所突破。

在生物製藥領域,蛋白質研究有著超然的地位,許多疾病需要透過分析蛋白質結構進行靶點判斷、藥物篩選、毒性判斷等。傳統的藥物設計一般要透過大批次篩選,尋找易與目標蛋白質分子緊密結合、易合成且沒有毒副作用的化合物來完成,因此研發週期長、費用高。而一旦瞭解了蛋白質的空間結構,就可以減少尋找藥物的盲目性,從而縮短研發週期並降低成本。因此,準確、快速的蛋白質結構預測不僅可以在學術研究領域幫助科學家快速獲得或驗證關鍵蛋白結構,促進人們對重要生命過程中分子機理的理解,而且在醫療健康和生物工程領域也能作為有力的工具,引發藥物靶點發現、功能蛋白設計(如抗體和人工酶)以及大分子(蛋白)或小分子藥物高通量虛擬篩選的革命。

就在近日,昇思MindSpore團隊與昌平實驗室、北京大學生物醫學前沿創新中心(BIOPIC)和化學與分子工程學院、深圳灣實驗室高毅勤教授課題組及鵬城實驗室陳杰老師團隊等合作聯合推出基於AlphaFold2演算法的蛋白質結構預測訓推一體工具。

傳統蛋白質結構預測方法一直存在計算精度不足的缺陷,直至2020年穀歌DeepMind團隊基於AlphaFold2利用計算機高效準確獲取蛋白質空間結構取得CASP14比賽(全球蛋白質結構預測比賽)中蛋白質3D結構預測的榜首,才讓這一缺陷得到彌補。蛋白質結構預測工具精度可與實驗方法相媲美,這一成就被Nature等雜誌喻為“前所未有的進步”。

北京大學等團隊推出的基於昇思MindSpore的蛋白結構預測訓推一體工具工具,大大降低了廣大生物醫療實驗工作者的使用門檻,也將為生物蛋白質領域的基礎研究與應用工作提供助力,在“前所未有的進步”上更進一步。該工具依託昇思全方位AI深度學習場景覆蓋的“八大套件”之一MindSpore SPONGE,可對氨基酸序列長度2000+的蛋白質結構解析,能覆蓋約99%以上的蛋白序列。該工具基於昇騰AI基礎軟硬體(昇思MindSpore + CANN + Ascend 910)實現了完整的 AlphaFold2 訓練和推理,其中訓練效能提升60%以上(TM-score達86分),推理效能優於原版AlphaFold2達2-3倍,相關程式碼全部開源。昇思對蛋白質結構預測訓練推理的支援填補了國產 AI 軟硬體的空白,今年昇思將在演算法、軟硬體支援等方向上持續創新,並計劃開放共享訓練資料集供業界研究者使用。

除此之外,同為“八大套件”之一的AI電磁模擬MindSpore Elec也開始影響終端電磁模擬領域。電磁場的產生主要源於自然和人工兩類。自然電磁場催生並推動了人類的文明:由於太陽光的存在,人類可以在溫度適宜的地球居住,可以透過植物的光合作用獲取充足的食物。然而人類並不滿足於自然產生的電磁場,於是開始主動向環境中發射電磁場,並充分挖掘電磁場的應用潛力。

人們透過實驗、理論以及計算等手段研究電磁場的機理。最終麥克斯韋總結前人的工作,提出了位移電流假說(變化的電場能夠產生磁場),完善了電生磁的理論,將電磁場理論用給簡潔、對稱和完美的數學形式表示出來,即麥克斯韋方程組。隨著計算機技術的發展,人們採用數值計算的方式去求解麥克斯韋方程組,模擬電磁場在空間中的分佈。但傳統的數值方法仍存在許多缺陷,如需要進行復雜的網格剖分、迭代計算,計算過程複雜、計算週期長。神經網路具有萬能逼近和高效推理能力,這使得神經網路在求解微分方程時具有潛在的優勢。為此,昇思MindSpore推出了AI電磁模擬套件MindSpore Elec。

MindSpore Elec內建有前後處理工具(資料構建及轉換、結果視覺化)、AI電磁模型庫(物理方程驅動和標籤資料驅動)以及最佳化策略(資料壓縮、動態自適應加權等)。

MindSpore Elec功能與模組框架圖

目前AI電磁模擬套件MindSpore Elec使用的增量訓練的AI方法,相比原始的PINNs方法,效能提升了15倍以上;與Benchmark(傳統的數值方法)的相對誤差在5%左右。MindSpore Elec套件已構築基礎的AI電磁模擬能力,並在手機電磁模擬等場景取得技術突破。在手機電磁模擬場景中,模擬精度媲美傳統科學計算軟體,效能提升了30倍。未來,昇思MindSpore將不斷深化八大套件的研究,推進科學計算在不同領域的落地應用。

CSDN認為,未來的十年將會是AI發展的黃金十年,深度學習演算法框架的發展牽動著業內每一個參與者的心。作為國內自研的AI+科學計算融合框架,昇思MindSpore積極響應產業界需求,不斷在效率提升、易用性、創新性以及使用體驗方面推動AI框架持續演進。正如“昇思”兩個字的含義,“昇”代表昇思是昇騰計算產業的重要組成,結合昇騰發揮極致效能,“思”代表著昇思深度思考產業界技術演進方向致力於打造最佳體驗的AI框架。當兩者像藝術一般相結合,就能為生產、科研提供最堅實的基礎,引領中國AI框架的發展。