數據帶來的不確定性

隨着無人駕駛汽車、機械人技術、深度學習,科技已經成為很多公司的不確定性因素(uncertainty)。情況就像我在阿里巴巴所經歷的6年內,「數據驅動」四字的內涵其實也不斷在探索中,首先是運用數據作精準決策,然後我們致力於把數據決策能力深入到業務過程中,同時阿里金融(數據創新業務)在這個時候應運而生。推薦系統及廣告業務作為阿里的核心數位業務,機器學習的引入讓大家眼前一亮,正好符合了淘寶的「小而美」的初衷。馬雲有一次在總裁會議提問:「為什麼高管都不用上班?但顧客需要你們服務啊!」後來這個問題演變成為今天的無人超市。

大部分公司在進行數位化變革的過程中,最容易出的問題是我們過於追求短期效率,但忽略了傳統企業的縱向分工及資訊管理的習慣,正好是不利於智識的複用(multiplexing)、共創、沉澱,也容易因為這樣失去了創新力。因此我提議數位化變革有三板斧:

一、應以數據戰略的定立為先。

二、根據戰略方向通過數據治理,解決數據的滙、通、用問題。

三、數據中台應該隨着一和二的成熟而建立相應的技術平台作支援,並致力於自動化提高效率。

如前所述,數據驅動在不同階段中,有着不同的治理方法及技術力度。例如業務的分析能力首先更講究指標口徑的訂立是否足夠敏感及一致性,但若要處理大量的非結構化數據(例如客戶投訴)作機器學習時則更趨向於保留數據原始性,因為我們既希望歸納客戶的投訴亦同時保留投訴作其他分析用途。如果企業已經到了數據資產化的階段,那時候數據的品質及安全合規就變得極其重要了。

當企業使用一個用短期解決方案來解決系統性問題時,依賴大量協同工作的數字變革很容易會陷入混亂之中,隨着時間的推移這些需要大量的內部協調和努力的工作會變得愈來愈困難,直至耗盡組織內的資源及信心。如果你把過去12至24個月企業中數據有關的開發專案作初步盤點,首先如果發現因短期利益而得到優先資源的項目佔比在70%以上的話,這警惕着數據治理資源沒有被重視;首次也可以審視數據在內部共用的情況,如果你發現完全相同的數據居然在重複存儲,也意味着數據的亂象已經在發酵。

許多企業在數據治理和業務優先之間停滯不前,加上創新業務的變化也在加速,數據的內容及量級也在快速反覆運算中。這導致了一個不斷往復的追趕外部因素的周期,這些因素包括了產品、演算法上、競爭對手等內外因素。你必須願意接受更多的不確定性,用一位前輩的話:「在你準備使用數據的同時,數據已經在開始衰變。」