奧推網

選單
文化

華為雲盤古大模型:讓行業AI走出象牙塔

山城重慶,是一個有導航也未必能夠找到目的地的城市,它不像其他城市,是一個平面,山城是立體的,就像是一級又一級的梯田。可想而知,在這樣的一個城市,電力巡檢的壓力要比普通城市大得多,不僅要走很多,還要爬很多坡。

現在,細心的重慶市民會發現,在城市當中出現了一些智慧無人機,它們取代了爬高的電力工人,承擔了巡檢任務,讓山城的電力巡檢不再艱難。

這是國網重慶永川供電公司落地的無人機智慧巡檢專案,它幫助電力部門,減輕了大量人工,還提高了巡檢的效率。

有人會問,對於國網重慶永川供電公司這樣一家傳統的電力企業,是如何做到快速將AI應用落地的?

這個秘密在於華為雲的盤古大模型,它的關鍵詞就在於AI訓練的效率。比如,以前訓練一個模型要人工標註上萬張的圖片,現在只需要幾十張;以前模型開發要一個物品識別一個模型,現在一個大模型就可以完成大量物品的識別。

很明顯,當模型開發和維護的數量大幅減少了,AI應用落地的速度就加快了。

產業智慧化的機遇與挑戰

產業智慧化正面臨前所未有的大機遇。

IDC釋出的《2020-2021中國人工智慧計算力發展評估報告》顯示:2020年新基建整體投資規模預計將達到2757。1億美元,人工智慧作為新基建的重要領域之一,也將迎來快速增長。IDC 預計,2020年中國人工智慧市場規模將達到62。7億美元,截至到2024年之前的年複合增長率高達30。4%。

《智慧時代:大資料與智慧革命重新定義未來》中預言,傳統的行業都將採用智慧技術實現升級換代,也會改變原有的商業模式。的確我們也看到,人工智慧在應用端的創新如雨後春筍,無人駕駛、智慧推薦等AI應用已經成為現實;在行業端,越來越多的企業將人工智慧視為數字化轉型的下一站。

在此程序中,AI的角色對企業來說也在潛移默化的發生改變。首先,AI是新的賽道,當新舊競爭壁壘更迭的週期,AI的能力將是企業跑贏對手彎道超車的機會,同時AI的能力也將重構企業護城河保證在未來的競爭中不容易被打敗。而企業級市場,由AI驅動的智慧化將改變行業的遊戲規則,數字化轉型的成果將很大程度上要參照智慧化的水平。

根據去年IDC的資料顯示:得益於安防、城市大腦等AI應用場景的帶動,AI在行業滲透,推動了政府、交通、公共事業、健康等行業的智慧化提速。

在巨大的機遇面前,人工智慧實現大規模行業應用的挑戰同樣存在:

首先,行業裡遇到的問題,如何轉化成AI可以解決的問題,如何將行業知識與AI結合;第二,如何降低AI的演算法、模型開發門檻,讓AI可以普惠;第三,將AI順利部署到實際的生產系統去中,始終是一個系統性的難題。

羅馬不是一天建成的,眼下最為緊迫要解決的問題還是要儘快降低AI的演算法、模型開發門檻。

因為,對於廣大的企業和AI開發者來說,如果每一次開發都是從0到1的過程,那麼AI開發的效率就很低,他們其實需要一種服務,能夠將有共性的模型和演算法預製,並沉澱一定的行業知識和經驗。

這就是華為雲之所以推出盤古系列超大預訓練模型的背景。

,時長06:18

今年4月,華為雲釋出了盤古系列超大預訓練模型,包括中文語言(NLP)、視覺(CV)大模型,多模態大模型、科學計算大模型。華為雲盤古大模型旨在建立一套通用、易用的人工智慧開發工作流,以賦能更多的行業和開發者,實現人工智慧工業化開發。

透過與行業知識結合,盤古大模型能快速實現不同場景的適配,加速AI行業應用,讓AI開發由作坊式轉變為工業化開發的新模式。

盤古讓行業AI走出象牙塔

華為雲一直認為,AI應該具備普惠屬性,不應該待在象牙塔,而應該面向千行百業。

盤古正是為此而來!

傳統的AI開發模式,有點像是“小作坊模式”,即針對每個場景,獨立地完成模型選擇、資料處理、模型最佳化、模型迭代等一系列開發環節。由於無法積累通用知識,同時不同領域的除錯方法有所不同,這樣的開發模式往往比較低效。

盤古大模型最大的價值就是打造了一種全新的“工業化開發模式”。將一套通用的流水線複用到各種不同的場景裡去,減少專家的干預和人為調優的消耗,從而降低人工智慧開發的門檻和成本。

是怎麼做到的呢?

最關鍵的就是預訓練模型,這個設計的目的就是為了讓開發者降低使用成本。模型的預訓練過程,成本是比較高的,但這個成本不需要開發者來承擔。而在使用這些大模型的時候,它本身的易用性會使得使用成本進一步降低,達到一個比較合適的水平。盤古正在做這樣的事,會給你更加通俗易懂的介面,能夠用一些拖拉拽的方式使用盤古大模型。

目前,盤古目前的預訓練模型包括了四個大的“分身”:

第一,文字大模型 (NLP)重點在於文字的理解和生成能力,可以理解文字背後的含義,從文字中抽取關鍵資訊,例如從法律文書中快速找出案件要素,提高判決效率,也可以輔助人類寫作;

第二,視覺大模型 (CV)重點在於視覺理解的能力,可以對各行業的影象進行識別和檢測,例如快速找出工業產品的缺陷,提高質檢效率;

第三,多模態大模型重點在於影象和文字的跨模態理解與生成能力,可以根據給定的文字生成影象,也可以根據給定的影象生成文字,可以幫助人類提高產品設計和藝術創作的效率;

第四,科學計算大模型的目標是幫助人類解決各種科學問題,如氣象預測、海浪預測、分子動力學預測、微分方程求解等,用AI技術來促進基礎科學的發展。

我們知道,預訓練模型要實現AI模型的通用性、泛化性和可複製性,要滿足幾個條件:一是底層具備足夠強的算力基礎;二是演算法自身的強度能夠達到世界一流;三是模型兼具穩定和效率,滿足工業級的企業應用;四是將人力調優轉換為AI自動化調優。

其次,在演算法層面,盤古的NLP模型在總榜、閱讀理解排行榜和分類任務排行榜上都位列第一,總榜得分比第二名高出一個百分點;同時,CV大模型採用 “層次化語義對齊和語義調整”演算法,在淺層特徵上獲得了更好的可分離性,使得小樣本學習的能力獲得了顯著提升,同樣達到業界第一。

最後,在調優環節,過去的模型開發需要專業技術人員投入幾個月的時間進行調優,但是現在調優由於盤古提供豐富的工具,可以大大簡化調優的過程,對技術人員的技能要求降低,這個能力也保證了更多傳統行業,不再畏懼走向智慧化轉型。

縮短AI普惠行業的距離

隨著應用場景的不斷成熟,人工智慧也正逐漸滲透到各行各業,產業智慧化將迎來爆發增長。無人駕駛、生物識別、欺詐分析、智慧客服、公共安全等應用場景都在加速行業落地應用。

行業AI最注重解決實際的場景化問題,仍然以前文提到的國網重慶永川公司智慧電力巡檢專案為例,就很好地解決了無人機智慧巡檢系統(缺陷檢測)中的小樣本學習、主動學習、增量學習等問題,解決了海量資料標註工作量大和缺陷種類繁多的問題。該專案中減少了人工標註工作量達170人天,同時將資料篩選效率提升30倍、篩選質量提升5倍,最終部署模型的精度相較基線方法提升18%以上。

而在智慧醫療領域,標註海量訓練資料需要耗費很大的時間和人力成本。為此,基於盤古預訓練大模型和行業小樣本資料微調的開發流程,將病例識別準確率提升22%,不僅保證了模型的精度,還大幅減少了時間和人力的消耗。

據悉,目前盤古預訓練大模型已經在多個行業、多個場景成功驗證,包括能源、零售、金融、工業、醫療、環境、物流等等。例如,在能源領域,盤古預訓練大模型幫助行業客戶實現裝置能耗的智慧控制,可以節約電力成本50%;在金融行業中的異常財務檢測,讓模型精度提升20%以上。

可見,盤古大模型已支撐起城市各行各業多種多樣的創新和智慧應用,成為了名副其實的城市數字化轉型的智慧基礎設施。

總結而言,華為雲盤古大模型實現了一個AI大模型在眾多場景通用、泛化和規模化複製,減少對資料標註的依賴,讓AI開發由作坊式轉變為工業化開發的新模式,節約研發成本。同時,盤古大模型還提供模型預訓練、微調、部署和迭代的功能,形成了AI開發完整閉環,極大地提升了AI開發效率。縮短了傳統行業走向智慧化的距離,賦能千行百業邁向智慧化的星辰大海。

2021年9月23-25日華為全聯接線上大會,華為高階副總裁、華為雲CEO、消費者雲服務總裁張平安將在主題演講中,釋出華為雲盤古家族新成員。