奧推網

選單
科技

資料要素論壇可信AI論壇:資料難以打通,如何解決?

【文/觀察者網 李煥宇 編輯/周遠方】資料,作為一種生產要素,已得到國家的高度重視。我國領導人明確指出,要發揮資料的基礎資源作用和創新引擎作用,加快形成以創新為主要引領和支撐的數字經濟,用大資料提升國家治理現代化水平。

但在應用端,不同部門資料難以打通、難以歸一、版本複雜、不夠完整等問題已經顯現出來,要讓資料充分發揮生產要素的功能,資料治理必不可少。

在上週的世界人工智慧大會上,幾位院士均強調了資料治理的重要性。中國工程院院士、計算機過程控制專家劉玠指出,對待資料要有長遠的眼光,要早規劃,早安排,好使它不至於在將來造成困擾。

而在資料治理這一塊,金磚國家未來網路研究院中國分院院長朱禹濤在接受觀察者網等媒體採訪時表示,想要打通部門隔閡,高效利用資料,需要用到人工智慧(AI),特別是可信AI技術,從而達到有效、科學、可控、可靠的效果。

眾院士談資料:對技術要樂觀 但也要早做規劃

7月10日的世界人工智慧大會“資料要素論壇-院士專場”活動,為一睹柴洪峰、劉玠、金智新、楊善林,王基銘,丁烈雲等中國工程院院士的風采,現場被圍得水洩不通。

首先發言的原華中科技大學校長丁烈雲先是從建築的角度講述了資料的應用和未來,指出建築將成為繼手機、汽車之後下一個智慧終端。並以大型國際機場、上海中心的設計、建造為例稱未來將是“演算法定義建築”。而主打低碳節能的智慧綠色建築和主打老人需求的智慧健康建築會是兩個主要的發展方向。

丁烈雲院士 影片截圖

但為了獲取住戶的需求資料,進行精準服務,此類建築必將鋪設大量的感測器,住戶會面臨類似“楚門的世界”一樣的困境。對此,丁烈雲院士表示,要對技術保持樂觀,因為技術是人創造的,人能造出它,也就有能力使其不利一面被最大程度的限制。

在電影“楚門的世界”中,男主從出生起就生活在一個巨大的攝影棚裡,他的一生被全程直播,唯獨他自己對此一無所知

接下來作報告的楊善林院士稱,要讓資料成為資源,成為生產要素,資料治理就是非常必要的,其核心內容包括質量、隱私、透明、安全。

以他自己參與的醫療大資料專案為例,“三多五缺”是他們面臨的很現實的困難,即做資料系統的廠商多,各醫院使用的資料系統多,不同的資料型別很多;缺乏資料彙總的標準、缺表、缺邏輯、缺欄位、缺專家。這種情況直到現在仍然是存在的,如果不進行治理,那這些資料就是廢資料。

透過對這些資料實行歸一化處理,建立了統一的資料模型,楊善林團隊實現了“變廢為寶”,也印證了資料治理的重要性。

楊善林院士 影片截圖

第三位發言的劉玠院士表示,資料是一把雙刃劍,像楊善林院士講解的醫療大資料,若要讓這些資料產生效益,就需要把各個醫院的資料拿到一起加以分析、治理,從而形成大資料。但想打破不同單位間的障礙不是一件容易的事情,而且正變得愈發困難。因為,大家都很看重自己的資料,不想把它給出去,這也就帶來了很多問題。

劉玠院士結合自己的企業經歷稱,企業資料有很多“噪聲”,要加以利用必須經過篩選。而且,企業資料目前還有很多不完整不確定的地方,哪怕就同一家企業,它在不同歷史階段的資料往往都是不標準、沒打通的。

劉玠院士 影片截圖

鑑於這些場景,劉玠院士希望,在做各位能有些長遠的眼光。既然資料這麼重要,有這麼多好處和應用場景,那就一定要從現在開始,有個長遠的考慮,對資料早規劃早安排,是我們的資料將來不至於造成更大的困擾。

王基銘院士也表示,資料作為一種新的要素,要讓它為我所用,很重要的一條就是資料的治理。不過,更重要的在於基礎資料的真實性,要搞清楚怎麼去偽存真,讓資料得到高效利用。

王基銘院士 影片截圖

朱禹濤院長:資料的高效運用需要可信AI技術

如何對資料進行高效利用是數字經濟時代的一大課題,除了各位院士,7月9日的世界人工智慧大會“可信AI論壇”同樣提到了這一話題。

金磚國家未來網路研究院中國分院院長朱禹濤在論壇上表示,大資料的大並不是資料多就叫做大,而是要把這些資料透過人工智慧有效利用起來進行分析,但這在目前存在很多的各種各樣的困難,因為大家都很擔心資料安全風險的問題,這就需要用到可信AI技術。

可信AI論壇會場 圖片來源:世界人工智慧大會

在接受觀察者網等媒體的採訪時,朱禹濤進一步表示,雖然“大資料”這個概念被說了這麼多年,但現在仍處於一個數據化的階段,真正的大資料時代還沒有到來,一是不同單位間的壁壘難以打通,二是大家對資料的隱私和安全不放心,擔心隱私洩露。

跟劉玠院士的經歷類似,朱禹濤院長遇到的很多企業同樣認為,“這些資料既然是我自己的,那我為什麼要放在雲上?這跟個人的擔憂有某種類似性,我的個人隱私你憑什麼拿?你會不會在我不知情的時候把資料拿走?”

朱禹濤認為,想要破解這層憂慮,除了政府要在立法方面進行規範、引導,還有就是要在技術層面上實現安全可控的資料使用和脫敏,讓資料在安全的條件下為我所用。而這就需要用到AI技術,尤其是可信AI技術。

比如大資料的清洗需要透過AI技術來完成,但要保證拿到的資料是脫敏的,而不觸及企業的原始資料,這就需要可信AI去識別、判斷。比如,我要調查一個目標的信用風險,我需要的是系統給我一個結果,而不是那個人的所有個人資訊,這就需要可信AI技術來實現這一過程。

所謂“可信AI”,指的是確保人工智慧的公平性、可解釋性、健壯性和透明性,確保AI的演算法可被人信任。

據上海市經濟和資訊化委員會主任吳金城介紹,隨著人工智慧即與之相伴資料隱私,演算法歧視,安全風險等治理問題引起全球多國政府,國際組織,研究機構和行業企業的共同關注。發展可信AI,推動人工智慧的透明可視,安全可控,多元包容已成為全球共識,

目前,中國在這一方面正走在世界前列。在7月9日的“可信AI論壇”上,中國信通院與京東探索研究院聯合撰寫《可信人工智慧白皮書》,首次系統提出可信人工智慧全景框架,全面分析可信AI落地面臨的挑戰與機遇。

白皮書聚焦於可信人工智慧技術、產業和行業實踐等層面,分析了實現可控可靠、透明可釋、隱私保護、明確責任及多元包容的可信人工智慧路徑,並對可信人工智慧的未來發展提出了建議。另外,穩定性、可解釋性、隱私保護、公平性將作為構成可信AI基礎支撐力的量化指標。

可信AI論壇會場 圖片來源:世界人工智慧大會

中國信通院院長餘曉暉表示,當前全世界各國都高度重視可信人工智慧的發展,發展可信人工智慧使我們真正最終能夠釋放出人工智慧的前景,能夠造福於全球我們人民的發展,這是一個關鍵的基礎。