數據中台服務對象廣泛

簡單地看,數據中台有點像一條生產流水線,從原始數據收集,到提煉成穩定的生產材料。在這過程中,需要有一套生產管理流程體系,用以保證數據品質、時效性、一致性等關鍵點。數據中台隨着數據生命周期的各階段(產生、存儲、增強、使用、傳輸、共用共創、更新、銷毀等)而建立,服務的對象可以是IT研發者、數據科學專家、產品經理、分析師、決策管理者等。

不過,上述比喻其實不無漏洞,起碼忽略了3點:一、數據可被無限次使用所衍生的迴圈;二、把多源異構的數據組合起來(有人叫作Stitch)的難度及品質問題;三、當業務發生變化時,平台的柔性適應力。

加快生產 減重複性

為了促進中台效率,阿里巴巴內部建立了數據公共層,首先是對於線上及離線的數據按交叉使用量、緊缺風險等進行盤點,基於現況及未來需要作中長期戰略規劃。這裏滙聚了阿里內部共用得最頻繁或者最關鍵的數據,這些資源有如生產中所需要的半成品,可以加快生產速度及減低重複性。公共層作為中台的一部分,積累了集團最關鍵的數據資源,同時也是最具備柔性及品質保障的主數據。

一切數據都是因應業務目標驅動而形成,產生於業務且又服務於業務。數據生產過程中極其重要的一類數據,被稱為中繼數據,又叫數據中的數據。對中繼數據管理得當,就可以讓數據在生產過程變得更精準、穩定及可被追溯。中繼數據管理須記錄生產過程中各項數據因素,包括生命周期、調度情況、品質保障、安全監控、數據字典、數據血緣關係等。中繼數據是數據中台的精髓,有利於數據在生命周期中的監督、成本管理或分攤、追蹤數據價值。因此,一般數據中台的價值體現可以根據數據開發能否化繁為簡作為考核,進一步理解就是數據反覆運算同步的效率。

數據中台賦能改革.三之二