數據應用須三大支撐

隨着移動互聯網、物聯網、雲計算、人工智能(AI),以及大數據等技術發展,不僅數據體量以指數級增長,更重要的是大數據的組成(多源異構)及治理的難度,為發展帶來愈來愈多障礙。近年智慧城市興起,數據如何為城市提供驅動力再次成為焦點,怎樣的數據平台才可駕馭這個比任何大型企業都更大的「業務」架構?集中式的數據存儲適用於未來的物聯網世界嗎?政府要做什麼才可賦能數位生態?這些新舊問題混雜,筆者將根據自身經歷,在本欄以連續三篇文章作出淺釋,望能拋磚引玉。

無獨有偶,企業內的一些問題,在各地的市政府機構內部也正發生,在缺乏頂層設計之下,資訊化步伐都在追隨各個職能部門的發展,數據體系也是基於業務單元垂直積累,從而形成了煙囪式體系。垂直式數據體系的優點是緊貼場景反應敏捷,缺點是數據分散、不標準,難以共用關聯,大數據價值優勢無法實現。此外,煙囪式數據體系還會造成混亂的數據調用和拷貝,除了重複建設造成資源浪費,數據難以溯源所帶來的歧義,亦將嚴重破壞數據品質。

自從大數據時代開始,我們就注意到數據安全是最大發展障礙。數據安全問題向來令人糾結,業界致力於保護數據的同時,又要兼顧業務發展需求,任何安全原則必須契合其商業目標及風險承受能力。運作至今大約十年,大數據總體趨勢是數據外部化、服務標準化、邊緣智能化、即時回饋等,讓安全邊界愈發模糊,風險評估難度更高。以往基於靜態分層的數據安全原則,難以有效防範威脅,這時候應該回到創新科技,包括機器學習、人工智能及區塊鏈,作為解決安全問題的手段。特別是區塊鏈使用加密與分散方式解決多方互信問題,是很值得期待的新途徑。

在認同大數據是未來創新核心的前提下,需要把數據戰略的先進性、前瞻性放到優先考慮位置。否則大數據的能力會隨着粗放式營運而變得停滯不前,淪為有名無實;數據愈亂,建立大數據的能力門檻愈高,從資訊化到數據化的時間節點都會影響治理難度。管理層必須理解,從資訊化到數據化再到應用,必須有強大的技術、靈活的政策,以及開放的生態支撐,方可馬到功成。

有見於此,阿里巴巴在2013年開始提出建設數據中台的概念;根據執行過程,再加上筆者離開阿里之後的觀察,針對數據中台有幾點看法想跟大家分享,不論大型企業或地區政府都值得參考。

數據中台賦能改革.三之一