華為雲盤古大模型：讓行業AI走出象牙塔

山城重慶，是一個有導航也未必能夠找到目的地的城市，它不像其他城市，是一個平面，山城是立體的，就像是一級又一級的梯田。可想而知，在這樣的一個城市，電力巡檢的壓力要比普通城市大得多，不僅要走很多，還要爬很多坡。

現在，細心的重慶市民會發現，在城市當中出現了一些智慧無人機，它們取代了爬高的電力工人，承擔了巡檢任務，讓山城的電力巡檢不再艱難。

這是國網重慶永川供電公司落地的無人機智慧巡檢專案，它幫助電力部門，減輕了大量人工，還提高了巡檢的效率。

有人會問，對於國網重慶永川供電公司這樣一家傳統的電力企業，是如何做到快速將AI應用落地的？

這個秘密在於華為雲的盤古大模型，它的關鍵詞就在於AI訓練的效率。比如，以前訓練一個模型要人工標註上萬張的圖片，現在只需要幾十張；以前模型開發要一個物品識別一個模型，現在一個大模型就可以完成大量物品的識別。

很明顯，當模型開發和維護的數量大幅減少了，AI應用落地的速度就加快了。

產業智慧化的機遇與挑戰

產業智慧化正面臨前所未有的大機遇。

IDC釋出的《2020-2021中國人工智慧計算力發展評估報告》顯示：2020年新基建整體投資規模預計將達到2757。1億美元，人工智慧作為新基建的重要領域之一，也將迎來快速增長。IDC 預計，2020年中國人工智慧市場規模將達到62。7億美元，截至到2024年之前的年複合增長率高達30。4%。

《智慧時代：大資料與智慧革命重新定義未來》中預言，傳統的行業都將採用智慧技術實現升級換代，也會改變原有的商業模式。的確我們也看到，人工智慧在應用端的創新如雨後春筍，無人駕駛、智慧推薦等AI應用已經成為現實；在行業端，越來越多的企業將人工智慧視為數字化轉型的下一站。

在此程序中，AI的角色對企業來說也在潛移默化的發生改變。首先，AI是新的賽道，當新舊競爭壁壘更迭的週期，AI的能力將是企業跑贏對手彎道超車的機會，同時AI的能力也將重構企業護城河保證在未來的競爭中不容易被打敗。而企業級市場，由AI驅動的智慧化將改變行業的遊戲規則，數字化轉型的成果將很大程度上要參照智慧化的水平。

根據去年IDC的資料顯示：得益於安防、城市大腦等AI應用場景的帶動，AI在行業滲透，推動了政府、交通、公共事業、健康等行業的智慧化提速。

在巨大的機遇面前，人工智慧實現大規模行業應用的挑戰同樣存在：

首先，行業裡遇到的問題，如何轉化成AI可以解決的問題，如何將行業知識與AI結合；第二，如何降低AI的演算法、模型開發門檻，讓AI可以普惠；第三，將AI順利部署到實際的生產系統去中，始終是一個系統性的難題。

羅馬不是一天建成的，眼下最為緊迫要解決的問題還是要儘快降低AI的演算法、模型開發門檻。

因為，對於廣大的企業和AI開發者來說，如果每一次開發都是從0到1的過程，那麼AI開發的效率就很低，他們其實需要一種服務，能夠將有共性的模型和演算法預製，並沉澱一定的行業知識和經驗。

這就是華為雲之所以推出盤古系列超大預訓練模型的背景。

，時長06：18

今年4月，華為雲釋出了盤古系列超大預訓練模型，包括中文語言（NLP）、視覺（CV）大模型，多模態大模型、科學計算大模型。華為雲盤古大模型旨在建立一套通用、易用的人工智慧開發工作流，以賦能更多的行業和開發者，實現人工智慧工業化開發。

透過與行業知識結合，盤古大模型能快速實現不同場景的適配，加速AI行業應用，讓AI開發由作坊式轉變為工業化開發的新模式。

盤古讓行業AI走出象牙塔

華為雲一直認為，AI應該具備普惠屬性，不應該待在象牙塔，而應該面向千行百業。

盤古正是為此而來！

傳統的AI開發模式，有點像是“小作坊模式”，即針對每個場景，獨立地完成模型選擇、資料處理、模型最佳化、模型迭代等一系列開發環節。由於無法積累通用知識，同時不同領域的除錯方法有所不同，這樣的開發模式往往比較低效。

盤古大模型最大的價值就是打造了一種全新的“工業化開發模式”。將一套通用的流水線複用到各種不同的場景裡去，減少專家的干預和人為調優的消耗，從而降低人工智慧開發的門檻和成本。

是怎麼做到的呢？

最關鍵的就是預訓練模型，這個設計的目的就是為了讓開發者降低使用成本。模型的預訓練過程，成本是比較高的，但這個成本不需要開發者來承擔。而在使用這些大模型的時候，它本身的易用性會使得使用成本進一步降低，達到一個比較合適的水平。盤古正在做這樣的事，會給你更加通俗易懂的介面，能夠用一些拖拉拽的方式使用盤古大模型。

目前，盤古目前的預訓練模型包括了四個大的“分身”：

第一，文字大模型（NLP）重點在於文字的理解和生成能力，可以理解文字背後的含義，從文字中抽取關鍵資訊，例如從法律文書中快速找出案件要素，提高判決效率，也可以輔助人類寫作；

第二，視覺大模型（CV）重點在於視覺理解的能力，可以對各行業的影象進行識別和檢測，例如快速找出工業產品的缺陷，提高質檢效率；

第三，多模態大模型重點在於影象和文字的跨模態理解與生成能力，可以根據給定的文字生成影象，也可以根據給定的影象生成文字，可以幫助人類提高產品設計和藝術創作的效率；

第四，科學計算大模型的目標是幫助人類解決各種科學問題，如氣象預測、海浪預測、分子動力學預測、微分方程求解等，用AI技術來促進基礎科學的發展。

我們知道，預訓練模型要實現AI模型的通用性、泛化性和可複製性，要滿足幾個條件：一是底層具備足夠強的算力基礎；二是演算法自身的強度能夠達到世界一流；三是模型兼具穩定和效率，滿足工業級的企業應用；四是將人力調優轉換為AI自動化調優。

其次，在演算法層面，盤古的NLP模型在總榜、閱讀理解排行榜和分類任務排行榜上都位列第一，總榜得分比第二名高出一個百分點；同時，CV大模型採用 “層次化語義對齊和語義調整”演算法，在淺層特徵上獲得了更好的可分離性，使得小樣本學習的能力獲得了顯著提升，同樣達到業界第一。

最後，在調優環節，過去的模型開發需要專業技術人員投入幾個月的時間進行調優，但是現在調優由於盤古提供豐富的工具，可以大大簡化調優的過程，對技術人員的技能要求降低，這個能力也保證了更多傳統行業，不再畏懼走向智慧化轉型。

縮短AI普惠行業的距離

隨著應用場景的不斷成熟，人工智慧也正逐漸滲透到各行各業，產業智慧化將迎來爆發增長。無人駕駛、生物識別、欺詐分析、智慧客服、公共安全等應用場景都在加速行業落地應用。

行業AI最注重解決實際的場景化問題，仍然以前文提到的國網重慶永川公司智慧電力巡檢專案為例，就很好地解決了無人機智慧巡檢系統（缺陷檢測）中的小樣本學習、主動學習、增量學習等問題，解決了海量資料標註工作量大和缺陷種類繁多的問題。該專案中減少了人工標註工作量達170人天，同時將資料篩選效率提升30倍、篩選質量提升5倍，最終部署模型的精度相較基線方法提升18%以上。

而在智慧醫療領域，標註海量訓練資料需要耗費很大的時間和人力成本。為此，基於盤古預訓練大模型和行業小樣本資料微調的開發流程，將病例識別準確率提升22%，不僅保證了模型的精度，還大幅減少了時間和人力的消耗。

據悉，目前盤古預訓練大模型已經在多個行業、多個場景成功驗證，包括能源、零售、金融、工業、醫療、環境、物流等等。例如，在能源領域，盤古預訓練大模型幫助行業客戶實現裝置能耗的智慧控制，可以節約電力成本50%；在金融行業中的異常財務檢測，讓模型精度提升20%以上。

可見，盤古大模型已支撐起城市各行各業多種多樣的創新和智慧應用，成為了名副其實的城市數字化轉型的智慧基礎設施。

總結而言，華為雲盤古大模型實現了一個AI大模型在眾多場景通用、泛化和規模化複製，減少對資料標註的依賴，讓AI開發由作坊式轉變為工業化開發的新模式，節約研發成本。同時，盤古大模型還提供模型預訓練、微調、部署和迭代的功能，形成了AI開發完整閉環，極大地提升了AI開發效率。縮短了傳統行業走向智慧化的距離，賦能千行百業邁向智慧化的星辰大海。

2021年9月23-25日華為全聯接線上大會，華為高階副總裁、華為雲CEO、消費者雲服務總裁張平安將在主題演講中，釋出華為雲盤古家族新成員。

奧推網

華為雲盤古大模型：讓行業AI走出象牙塔

相關文章閱讀