《AI.未來》一書作者說:「如果數據是新的石油,中國就是新的OPEC(石油出口國組織)」,可想而知大家心目中數據的未來地位。
不過最近有數據專家指出,「數據是新石油」的比喻可能有偏差。因為這很容易讓企業及政策制訂者從這一比喻中得出的結論,以為僅要得到的數據愈多,獲得的人工智慧(AI)發展優勢會愈大。
這樣有可能導致對數據收集的過程中產生誤解,從而造成決策失誤,也容易迫使社會在私隱和創新之間作出妥協。例如,大家會過於強調收集數據(數據量本身最為重要)的想法可能導致我們減少關注科技公司的數據私隱及倫理問題,過大數據的健康發展造成傷害。
數據是石油的比喻完全沒有考慮到數據的使用場景並不像石油一樣能廣泛。忽視了數據收集來源(地區、行業、商業模式、個人習慣)很影響機器學習(例如:人臉辨識、語言處理)的品質。從上海的零售數據分析得出的購買習慣並不完全適用於倫敦。
當然數據比諸於石油的優點是可以被反覆使用、複製和修改。
我並不是說「數據是新石油」的比喻是無稽之談, 反而是隨着數據驅動的人工智慧的加速普及。我們發現了現在企業更欠缺的是負責「數據優先」戰略實施的人才,他們的責任是機器無法取代,也可以說是「新石油」組成的先決條件。我嘗試列出一些選項:
(1)企業內部有人要懂得如何協調不同部門之間數據策略,包括統一標準、流通方式、安全管控等。
(2)為公司的內外數據收集、調度及滙總策略作出決策,同時為維護數據品質的把關。
(3)通過數據主動發現數據增強的戰略機會,為數據的廣度與深度的需求作出判斷。
(4)改變企業內部文化,讓業務人員成為數據驅動的第一線。
(5)根據業務需求及資源,打造出企業以大數據資產作為重點的未來走向路線及規劃。
以上的舉例中,都是告訴大家把注意力放在機器不能取代的數據相關工作上,可想而知數據是不是石油,取決於人類如何讓數據成為企業決策、營運、資產增值的依據。
如果企業相信數據是新石油,那麼兼備數據能力和商業背景的人才必不可少。