奧推網

選單
科技

智慧城市,讓生活更美好

編輯導語:隨著現代科技的不斷髮展進步,智慧城市的建設也在不斷髮展,本篇文章作者分享了有關智慧城市的內容,從智慧城市的概念、背景和發展歷程、特點以及專案架構設計等內容都一一講述,感興趣的一起來看一下吧。

一、如何理解智慧城市/智慧城市是什麼

提到智慧城市,常會想起上海2010年世博會“Better city, Better life。城市,讓生活更美好”。關於智慧城市,其實沒有一個共識性的定義,想從這兩點談談對智慧城市內涵的理解。

1. 從AI+行業理解

我們在談論AI+、智慧化概念的時候,說的是以人工智慧技術升級傳統行業。那

智慧城市就是以人工智慧技術升級城市公共服務。

麥肯錫的《智慧城市:數字科技打造宜居家園》報告中包括了出行、安全、健康、能源、水、垃圾、經濟發展和住宅、參與和社群。不同廠商智慧城市解決方案覆蓋的行業範圍大有差異。

2. 從政府職能理解

《新型智慧城市發展報告2017》對智慧城市的定義是“智慧城市系統應是一個全面、精確、實時把老百姓需求與城市管理決策對接在一起的決策輔助系統,是一個政府、社會、公眾三方參與的可持續的商業模式”。

我理解政府職能可以粗略劃分為決策和服務兩大類,智慧城市涉及G端、B端、C端三端使用者,

是把C端使用者、B端企業和G端政府精準對接的輔助決策系統

如何對宏觀和產業做出更精準的決策;如何服務好企業,降低資訊不對稱性讓企業少跑腿;如何服務好普通市民,讓市民生活便利,更美好,實現更精細化的管理決策。比如阿里雲城市大腦解決方案中頂層按G端、B端、C端分為優政-政府治理(G端)、惠民-城市服務(G端)和興業-城市產業(G端)。

二、智慧城市的背景和歷程/為什麼會有智慧城市

2017年國家提出數字中國戰略,2018年各省份制定數字經濟、數字城市、數字政府等未來多年戰略規劃。密集出臺了《關於促進智慧城市健康發展的指導意見》、《國家智慧城市頂層設計指南》、《新型智慧城市評價指標(2016年)》等。大體政策歷程可以參考華潤《智慧城市白皮書城市建設運營數字化轉型》。

圖片來源:《智慧城市白皮書城市建設運營數字化轉型》

《華為AI賦能智慧城市白皮書》將智慧城市發展歷程劃分為試點探索(2012-2014)、落地實施(2014-2016)、發展轉型(2016-2020)、新篇章(2020至今)四個階段。劃分標準是從政策檔案出發進行劃分。

《百度智慧城市白皮書》將智慧城市發展歷程劃分為概念匯入期(2008-2012)、試點探索期(2012-2016)、統籌推進期(2016-2020)、整合融合期(2020至今)四個階段。劃分標準更多是從技術和推進方式來劃分。

三、智慧城市專案的特點

1. 週期長、回款慢、工期緊張

從時間維度看,政府專案有周期長、回款慢、工期緊張的特點。週期以年為單位,交付部署完後還有後續運維期(一般3年)。

專案初期由渠道商務打單,政府與多家意向單位溝通,聽取各家解決方案並選擇最合適的。由於招投標一般中期才開始,供應商需要前期提前投入,且專案初驗、終驗不同階段才能獲得對應款項。

需要成本把控和風險防範。可能的風險點有,一是專案廢標,如去年年底Z市公安1億專案廢標;二是客戶中途替換供應商;三是客戶覺得功能已經實現開始砍價。需要控制客戶預期,做好投產評估。

2. 參與主體多、利益複雜

從參與主體看,政府專案有參與主體多、利益複雜的特點。參與主體有客戶、供應商、監理等。客戶側,客戶有不同的層級,高層領導、中層幹部、基層辦事員。日常工作中接觸最多的是基層辦事員,瞭解其工作流程和痛點。中層幹部一般是週期性彙報或者節點決策時出現。而只有在專案啟動會或者重大的彙報節點,才會和高層領導接觸。

這裡存在兩個錯位的三角形,決策權:

高層領導>中層幹部>基層辦事員,對接密度:基層辦事員>中層幹部>高層領導。

政府專案一般遵循自上而下的建設路徑,領導意志層層下達,過程容易扭曲。如果涉及多個部門的專案,會出現領導意見紛雜、眾口難調的情況,不同部門間可能存在深層次利益衝突。

供應商側,可能情況有,一是專案分為ABC多個包,不同的包由不同供應商負責;二是政府只會和有資質、體量大的公司籤合同,這一公司作為總包,再把各模組分包給更有專業優勢的分包商。

3. 需求變更頻繁

這一特點是由特點2衍生的,“我不知道我要什麼,我只知道我不要什麼”。

智慧城市專案需求是自上而下傳導的,可能是政策導向性業務需求,可能是機構領導指派的任務,也可能是為了解決機構內部問題。需求需要決策審批,由於多層級領導,決策鏈路長,中途易發生需求變更,可能面臨多次推翻。

4. 需要考慮系統融合

這裡針對二期、三期專案而言,需要考慮與一期已經建成系統的融合。即使一期做得不盡人意,客戶也不會希望花了大價錢的系統就荒廢了,還是希望能夠和二期三期銜接起來。

5. 注重安全性

政府一般有內網和外網之分,專案注重安全性,需要本地化部署或者專有云部署。

四、智慧城市產業圖譜及專案架構設計

1. 智慧城市產業圖譜

圖片來源:《中國信通院2020智慧城市產業圖譜研究報告》

2. 智慧城市專案的架構設計

感知層:

底層是外部資料的收集,“模態”是生物憑藉感知器官(視覺、聽覺、觸覺、味覺、嗅覺)與經驗來接收資訊的通道,多模態感知指的是透過感測器、探頭等硬體裝置採集外部資料,將獲取的資訊包括文字、圖片、音訊、影片等進行融合。

平臺層:

資料資源中心,包含資料管理和運營、資料儲存和計算、資料治理工具等模組,對從感知層採集到的資料進行加工,為模型所用。模型處理中心,包括深度分析、智慧預測、視覺計算等模型。

應用層:

即應用場景,對平臺層處理過的資料和模型結果進行應用。包括優政-政府治理(TO G)、惠民-城市服務(TO C)、興業-城市產業(TO B)。

五、智慧城市的常見問題

甲子光年曾做過兩篇關於智慧城市的報道《7年了,為什麼智慧城市還不智慧?》和《三問智慧城市:建設8年為何還處在初級階段?》提到資料孤島、資料共享難的問題。基本每個專案都會遇到這個問題,政務服務資料管理局、大資料管理局的成立,政府資料統一開放平臺的建設,都是為了打破煙囪林立,資料孤島的局面,但目前效果沒有預期的好。登入一些地方的政府資料統一開放平臺,很多資料目錄中包含的資料欄位很少,且口徑較粗,都是表面資料,沒有細顆粒度資料,難以展開分析和下一步工作。

六、從PM視角看智慧城市機器學習專案的落地

有天在商場看到廁所外面有一個智慧螢幕,上面顯示蹲位剩餘情況比如“5/14”或者“空”。

我們找了一個兒童廁所試驗了一下,進去關上門後從原本的0/3變成了1/3。思考下這個場景背後的需求和實現。在旅遊景區、機場、火車站、商超等人流量密集的大型公共場所,上廁所經常是一個痛點,找廁所費勁、廁所排隊時間長、衛生清潔狀況差等。

作為管理人員,傳統的解決方案是更加清晰顯眼的指引路牌、合理規劃蹲位、加大清潔人員值班的密度等。是否可以藉助人工智慧使公廁更加智慧化和便民化?

比如透過感測器、物聯網技術提醒紙巾、洗手液等物資供應補給;透過人流量和物資消耗資料建模計算調整清潔頻次;根據廁所人流量和距離推薦最優選擇,提醒遊客旅客前往人流量小的廁所等等。

這裡想從PM視角將看機器學習專案落地的全過程:

1. 需求定義

在和客戶溝通交流的過程中,分析客戶的需求,傳統方式是什麼,是否需要AI加持,透過AI加持可以達到什麼效果。在需求定義過程中產品需要做的事情:

與客戶加強溝通,瞭解客戶的需求,客戶對模型能力的預期。如推薦的實時性、預測的精度、使用模型後用戶滿意度能提升多少等等,

最好是有一個定量的目標,便於研發同學進行評估

將抽象的業務問題轉化為數學問題或者技術問題並傳達給研發同學進行技術預研。如根據廁所人流量和距離推薦最優選擇,轉化為透過感測器收集到廁所人流量資訊、透過LBS收集到使用者和廁所的距離資訊進行建模。

向研發介紹需求背景、業務目標、資料大致情況,由研發評估技術可行性和投產。

2. 資料採集

機器學習建模需要用到大量資料,在資料採集過程中,需要解決模型需要哪些資料輸入、資料從哪裡來、是否需要標註等問題。

在資料準備過程中產品需要介紹資料流轉和採集方案,與研發同學共同確定所需欄位和表結構。

3. 資料預處理

採集完資料後,並不能馬上開始建模工作。在一個數據分析建模的專案中,資料清洗工作量可能高達80%。資料質量的好壞直接影響了建模效果,所以在資料採集完後,需要對資料進行清洗加工,確保入模資料的質量。常見的資料問題有

資料缺失、日期格式不統一、重複、口徑不統一、頻率不統一、髒資料等

,這裡總結了一些資料處理的方法。

資料缺失處理:

設定缺失閾值,如果缺失情況超出了既定閾值,就剔除相應指標,如果沒有超出則保留並補全缺失值。補全方法有以某個設定的常數替換缺失值;以均值、中位數或眾數替換缺失值;以隨機生成的值替換缺失值。

去除異常值:

避免極大極小值(outliner)對模型的影響,比如K-means演算法對異常值非常敏感。

口徑不一致需進行統一:

有些指標是絕對值,有些指標是當期同比,有些指標是累計同比,需要進行統一。指數或已經帶百分比率的指標一般不需要計算同比。

頻率不一致需進行變頻:

有些是高頻如日、周的指標,有些是低頻如月、季的指標,需對指標進行變頻處理,注意只能是高頻變低頻,變頻也有多種計算方式,如合計值、平均值、是否限於當年等,需根據業務情況進行評估和選擇。

進行平穩性檢驗:

不符合平穩性檢驗的要進行差分處理。

在資料預處理完後,切分資料集,一般分為訓練集、測試集和驗證集。如果只有訓練集和測試集,一般按照70/30劃分,如果加上驗證集,則按60/20/20劃分。

在資料預處理過程中產品需要與演算法共同確認資料清洗規則。

4. 模型構建

在資料清洗完後終於來到了建模這一步。此處引用劉海豐老師的定義:

建模的過程是從樣本資料中提取可以很好描述資料的特徵,再利用特徵建立出對未知資料有優秀預測能力的模型。

機器學習三大場景為分類、迴歸、聚類,具體應該用哪一種模型,需要根據目標變數進行定義。如果預測結果是兩個離散的值,適用分類模型。如果預測結果是連續的值,適用迴歸模型。常見的分類演算法有LR,NB,SVM,DT,RF,KNN等,常見的迴歸演算法有lasso,ridge,gbrt,xgboost, garch常見的聚類演算法有K-means, dbscan等。研發同學會根據目標變數、資料情況,結合演算法優劣點,選擇合適的模型。

5. 特徵選擇

前文提到運用機器學習模型,輸入大量指標,輸出目標變數的預測值。

並不是所有我們能獲取的資料指標都會用在模型預測上,

我們要找到優質的因子/特徵,簡單來說就是找到那些對目標變數Y預測效果好的解釋變數X

篩選方法有很多種,比如常見的斯皮爾曼相關係數、皮爾遜相關係數等,或者一些自研方法。在經過數理檢驗篩選出一批優質特徵後,我們還可以從業務意義進行進一步篩選。

6. 模型訓練與評估

透過不斷地訓練模型、驗證模型和調優,達到最優的預測效果。對模型效果進行評估。迴歸模型常用的評價指標有MAE平均絕對誤差、MSE均方誤差、RMSE均方根誤差,誤差數值越小越好。

分類模型常用的評價指標是基於混淆矩陣的accuracy,precision,recall,F1-score等。混淆矩陣:

True Positive(真正,TP):將正類預測為正類數;

True Negative(真負,TN):將負類預測為負類數;

False Positive(假正,FP):將負類預測為正類數;

False Negative(假負,FN):將正類預測為負類數。

7. 模型融合

機器學習同時訓練多個分類和迴歸模型,再透過整合的方式進行模型融合,提升模型預測的準確率。迴歸模型的融合是透過演算法平均或加權平均,常見的融合方法有bagging, boosting和stacking,分類模型的融合是透過投票融合方法,票數最多的預測結果為最終結果。

參考材料:

阿里城市大腦解決方案;

華為AI賦能智慧城市白皮書;

華潤智慧城市建設數字化轉型白皮書;

百度智慧城市白皮書;

麥肯錫智慧城市:數字技術打造宜居家園;

中國信通院2020智慧城市產業圖譜研究報告;

7年了,為什麼智慧城市還不智慧?| 甲子光年;

三問智慧城市:建設8年為何還在初級階段?| 甲子引力。

本文由 @RfSr 原創釋出於人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基於CC0協議。