奧推網

選單
科技

2023年AI更冷還是更熱?資料要素成焦點,三大前沿趨勢透析

智東西

作者 | 李水青

編輯 | 漠影

剛剛過去的2022年,是人工智慧(AI)產業焦點快速切換的一年。

紅極一時的計算機視覺、智慧語音等AI演算法賽道迴歸冷靜,資料智慧新領域變得更加炙手可熱。

隨著2022年東數西算工程、“資料二十條”等政策推出,資料的生產力要素地位更加凸顯,發展大資料產業成為數字經濟發展的迫切要求。知名行研機構IDC預測,2026年中國大資料IT支出規模將達359。5億美元(約合2438。13億元人民幣),複合增長率達21。4%。

知名國產大資料基礎軟體公司星環科技技術VP(高管)楊一帆告訴智東西,前幾年AI企業落地以單一模態技術為主,比如以單純的圖象資料分析支援影象識別、身份認證等應用。近年隨著技術市場和應用市場的逐漸成熟和深入,單模態、單模型難以應對實際落地過程中複雜場景的需求,為資料智慧的進一步發展提供了動力。

作為人工智慧三大要素之一,資料正為AI產業帶來新的活力。楊一帆認為,面向新的2023年,多模態資料分析、可信AI、開發運維一體化有望成為產業發展的三大新趨勢。

一、打破資料孤島,多模態資料分析興起

進入十四五數字化轉型時期,我們看到政企行業資料的豐富程度和增長速度都很可觀,多模型、多模態資料成為AI產業發展的新特徵。

隨之而來的是嚴重的資料孤島、知識壁壘,阻礙了AI落地程序。

以智慧零售場景為例,當某商場需要從消費商品評價研究特定人群的消費偏好時,他們至少需要使用人群“關係”、消費“記錄”、商品“評價”等不同來源或形式的資料進行分析。按照傳統方法,這些資料通常來自不同資料模型的資料庫,而商場的分析團隊需要適配多種資料庫的連線、查詢、開發、分析技術等,不僅流程複雜、效率低下會帶來決策時效性差,而且資料不一致引起的決策誤導也容易出現。

在這種背景下,一種基於統一架構的多模態資料分析工具應運而生。

面向多模態資料分析需求,星環科技多模型大資料基礎平臺TDH9。0(Transwarp Data Hub)提出統一架構:透過統一介面、統一計算引擎、統一分散式儲存管理系統、統一的資源排程,匯聚十種資料模型組合拳,打通了大資料業務全場景。

比如基於TDH9。0,前文提到的智慧零售資料分析難題將被解決,客戶能一舉實現跨三個表聯合分析,同時無需額外資料匯出或者轉換,在準確分析的同時簡化開發流程和使用者操作。

值得一提的是,星環科技還透過知識圖譜平臺Sophon KG加持TDH9。0,增強多模態資料分析的認知智慧化水平。

以金融行業為例,Sophon KG開發的影象和自然語言處理模組,支援從文字、影象、關聯資料、表格資料等多種型別資料中,自動抽取和推理行業、公司及機構名、地址、人名、產品、時間等實體、關係和事件,從而透過多模態資料分析幫助相關機構智慧化識別可疑交易、發現黑灰產團伙、畫像貸款人違約風險、預測擔保人風險等。

可以看到,多模態的資料分析已成為AI產業落地迫切需求。它有利於企業打破資料孤島,進而從資料這一底層生產要素推動AI向認知智慧進化,以此幫人們解決場景更復雜的問題。

二、提倡資料流通交易,可信AI成剛需

隨著AI落地進入深水區,AI還面臨越來越多的可信挑戰。

比如AI模型可解釋性的缺乏限制了AI獨立應用,系統如何在使用資料的同時保護使用者隱私,AI系統如何避免不穩定性帶來的安全問題等,這些問題在近年來尤其凸顯,《新一代人工智慧治理原則》、《人工智慧演算法金融應用評價規範》《關於加強科技倫理治理的意見》等規範和標準相繼釋出。

進入2022年,東數西算、“資料二十條”、資料安全法及個人資訊保護法等政策制度的推出,全國多家資料交易所落成,讓資料生產要素的地位凸顯,資料交易和應用有望迎來規模化階段。可信AI技術,是促進資料智慧產業規模化的前提和保障。

為實現“資料-AI模型-業務”全鏈路的可信,星環科技提出了一種通用的可信AI治理框架T-DACM。楊一帆對智東西解讀道,這一領域具有“短板效應”,任意一個數據處理環節出問題都會導致最終模型不可信。

為此,T-DACM框架覆蓋了AI開發應用的全流程,從可信資料(Trusted Data)、可信演算法(Trusted Algorithm)、可信計算(Trusted Computation)、可信管理(Trusted Management)四個層面,覆蓋了資料安全、模型安全、隱私保護、風險控制、過程管理、可解釋性、公平倫理、追溯追責等AI熱點問題的解決方法。

楊一帆談道,T-DACM框架能有效提升模型精度、解決模型黑盒問題。比如,在某銀行授信系統案例中,據稱該方案助其模型精度提升至99。2%,失聯使用者率降低至0。4%,並透過引入模型可解釋模組解決了客戶評分差異無法解釋等問題。

不過值得一提的是,從當前產業發展程序來看,AI模型的黑盒仍未完全解開。因此,可信AI治理髮展任重道遠,需要產業繼續完善可信AI框架並在實際場景中迭代升級。

三、資料流水線成熟,AI開發運維一體化

開發運維一體化,是2022年AI行業發展的另一大趨勢。

用資料科學賦能產業,說白了,就是透過資料特徵提取、AI模型構建提供分析服務,來促進業務降本增效、提升體驗。近年來,隨著資料和模型種類變多,散落在企業多個部門的管理和運維成本也在變高,面臨一系列挑戰。

對此,楊一帆認為,面向資料科學全流水線的轉型正成為一大新趨勢,數字化轉型的客戶需要開發運維一體化。

面向AI落地,星環科技推出了企業級AI能力運營平臺Sophon MLOps,圍繞企業AI模型接入、運營管理、持續訓練的全生命週期,分別提供規模化整合管理、高效模型推理、模型監控預警、模型效能評估、隱私安全保障等功能;同時,面向大資料開發,星環科技透過TDS(Transwarp Data Studio,星環大資料開發工具)提供DataOps能力;面向軟體開發,星環科技透過TDC(Transwarp Data Cloud,星環資料雲平臺)提供DevOps和資料雲服務能力。

楊一帆說,DevOps提供了一個開發整合的底座,DataOps提供了一個數據不停地整合開發的前提,MLOps進行AI資料分析方向的持續提升的使命。

透過將資料智慧多個環節能力“連珠成鏈”,意味著產業流水線進一步走向成熟。可以預測,以星環科技為代表企業提出的全流程化的資料智慧平臺如果深入實踐落地,有望促進產業生產力大大釋放。

結語:AI落地進入深水區,資料要素重要性凸顯

資料智慧成為AI落地深水區的一大新焦點,透過對話星環科技技術VP楊一帆,我們進一步透析了資料智慧所面臨的多模態資料分析、可信AI、開發運維一體化幾大發展趨勢。

根據中國信通院最新研究資料,2021年我國大資料產業規模達1。3萬億元。隨著數字化轉型和相關新政策推進,產業的大資料平臺技術也加速落地和迭代,有望促進2023年資料智慧產業呈現新突破局面。