什麼是數據策略:數據的獲取、架構、治理、以及應用

隨著人工智慧的成熟、BI技術的普及、以及越來越複雜的供應鏈、通路、以及消費者行為,數據已然在近十年當中,逐步地成為了企業競爭的核心。擁有越多數據,同時能夠能應用越深的企業,主導著競爭中層面上的決定因素。譬如:

在定價中,倘若價格成長1%,在銷售量維持的情況之下,通常能為營業利潤(Operating Profit)創造8.7%的增長。然而絕大多數的企業(B2B公司由其),定價策略往往圍繞在習慣,而非數據驅動的科學。故此,越能充分挖掘資料、支撐洞見、同時落實策略反饋的企業,通常就能相較競品有更高的競爭力。

在整個供應鏈中,企業更是能全面性的應用數據,從採購、生產、倉儲、物流、銷售點、客戶、一直到產品設計整個價值鏈中創造卓越的價值,不僅能驅動運營卓越以降低成本、提高預測精準以提升供需匹配、同時還能透過供應商分析、以及客戶分析等等應用,提高組織效率與整體獲利。

在行銷與銷售中,數據分析更是賦能所謂的品牌相關性的核心要素,透過渠道分析、市場分析、以及顧客旅程分析等手段,大幅提高消費者的體驗,延長顧客生命週期,以及每一消費者的獲利等。

決策者們都意識到了數據的重要性,沒有充分應用數據的潛力,先不提其效益,企業可能在未來甚至會失去了根本的競爭力。

雖然趨勢是如此顯著,但在我們的實務經驗中,我們卻發現許多企業,不僅時常沒有所謂的完善的數據基礎建設、建立數據的架構與治理、落實數據的報告與分析等,其更是缺少一個核心的數據策略,去支撐每一個數據業務的發展。

什麼是數據策略?

簡單來說,數據策略就是一個以數據為主軸,橫貫組織上下的每一個業務功能的策略,目的即是獲得越多、越豐富、越乾淨、且越有效的資料;以更低的運營成本架構越具可擴展性(Scalable)、穩定、高整合性的數據架構;可支撐性高,且極度自動化的數據治理手段;同時充分的應用大數據、人工智慧、以及商業分析等手段,挖掘出商業價值的數據應用。

數據策略|數據生態系統
數據策略|數據生態系統

簡而言之,我們可以將一個完整的數據策略必須要涵蓋這四個要素,也就是數據的獲取、數據的架構、數據的治理、以及數據的應用。

數據獲取(Data Acquisition)

在獲取數據這一層面中,企業的主要目的有三個,而重要性也是以此排序:

  • 獲取越有效的資料:通常在思考要獲得更多資料、更乾淨資料之前,評估究竟要獲得哪種資料,以及這些資料能夠如何支撐後續決策是最為關鍵的。如此,在評估Software Vendor、IT投資、還是第三方資料的應用時,都能更加精準的推斷出它如何被應用,潛在能夠創造的價值,並且回饋至採購的決策中。

    一個重要的思考方式即是,將欲獲取的數據,轉換為使用案例,或稱應用場景。簡單來說就是回答在獲得這一份資料後,將可以如何支撐不同面向的決策,並創造了多少價值。譬如可能某家公司在產品的開發上,往往無法很好的呼應到消費者的需求,那麼在這一維度上,是否投資在社群聆聽,抑或是追蹤競爭品項的動態,將能提高產品開發的相關性?同時也思考相應的投資,並且用MVP的方式在企業內部推行(也就是從小投資開始,確定產生明確價值後,在加大投資)

    在以一個案例來說,以一間專注於遊客消費的全國連鎖零售為例,他們可能在安排人手時,一直以來都是以去年同期、上週同期、抑或是當地主管的經驗來排班,這雖然也許是一個好方法,但是仍然受到許多主觀判斷的限制,而導致排班結果在有些時候無法呼應到真實情況,而發生了人手不足導致的客戶體驗下樣、抑或是門市人手過剩,而導致運營成本支出過高等狀況。

    在這一情況來說,這間以遊客消費為主的全國連鎖零售就可以思考哪些資料可能是更有效的,譬如天氣資料、住宿平台的訂房資料(從庫存數量以及價格反推)、景點的旅遊狀況、火車或是飛機票價等都可能是可以支撐決策的數據。那麼在這一環境中,就可以先將過往歷史紀錄來交叉比對這些資料,以評估出哪一筆,或是哪幾筆資料與實際人流的數字相關性最高,並以此成為MVP的第一個功能,創造充分價值後,在持續擴展其發展。

  • 獲取更多、且更豐富的資料:建立於在數據的獲取有明確的方向後,如何獲得更多、更完整的資料即是下一個該問的問題。再回到我們前面產品經理的角色中,許多傑出的PM在評估產品開發方向時,往往會做通過競品的用戶評論、社群媒體的討論、或是自有的像交易紀錄、甚至是用戶主動/被動反饋的使用紀錄等方式,來獲得較深的洞見,並且回饋至產品開發當中。

    但實務上來說,這一模式時常會受主觀判斷的原因,而難以成為支撐決策的充分佐證,再者,其經常要花上非常多的時間,才能獲得較充分的資料。所以若要獲得更多、更豐富的資料的話,其可擴展性是較差的。所以我們認為,建立於方法的可行性後,團隊就可以思考是否要整合IoT至產品上,以取得較深的用戶洞見,抑或是自動探勘如社群媒體、搜尋資料、電商資料、交易資料等等手段,來支撐產品經理與相關團隊在思考開發方向的決策
  • 獲取越乾淨的資料:資料的乾淨程度,時常也稱作資料的品質,是一門非常重要的學問,在獲取階段能否落實往往取決於一開始的設計。 譬如以一位BCG顧問 Salvatore Cali經手過的案子,即發現一間國際銀行的用戶資料中,有超過10%的客戶為阿富汗的會計師,最後才發現在網頁上的表單填選中,阿富汗是第一個國家,而會計師也是第一個職業。像這樣的案例在實務上有非常之多。 同樣的還有譬如當企業在訪問、調查客戶時,往往在題目上的設計,使用了一些文字會導致客戶更傾向於某些選項,如此,就獲得了各種低品質的資料,影響整體的判斷。

    獲取的數據乾淨與否,對於後續的決策來說至關重要,但這一領域中,時常並不是一個IT問題、或是說數據問題。而是設計、統計、以及用戶習慣的問題。故此,在獲取的階段中,團隊應該要更全面的以客戶角度去審視現有的數據獲取渠道,以了解是否有一些意料之外的狀況,正在導致錯誤的發生。

數據架構(Data Architecture)

於數據架構中,最佳實務的落實是非常重要的,在這一階段中,團隊有幾個主要要達到的目標:

  • 數據必須要是共享的:為了促進跨團隊、甚至跨部門的協作,在現代的數據架構環境中,數據必須要是容易讓所有相關人員都能有權限獲得的。譬如對於行銷人員來說,獲得業務人員第一手的資料可能對於優化行銷渠道的部署就被非常重要。對於業務人員來說,獲得現在存貨在整個供應鏈的狀況也非常重要,故此,組織就必須要賦能不同相關人員獲得這樣的權限。
  • 資安第一:雖然賦能越來越多的人獲得訪問數據的權限是重要的,然而同樣的也不能忘記落實資安的完善,譬如讓不該訪問某些數據的人員獲得訪問權限,讓不該獲得編輯權限的人獲得編輯權限等。這些都將成為潛在的資安漏洞。
  • 高易用度:時常,在某些企業中,基礎建設確實支撐了數據被共享的能力,然而在實務中,糟糕的使用者設計、缺少Documentation、繁雜的資料庫架設等等都限制了這些數據被應用透徹的潛力。所以思考數據架構時,同樣也要思考如何讓整個基礎建設能夠支撐使用者的使用。
  • 高度敏捷:數據在架構中,應該盡可能地讓不同渠道的資料,能夠實時的更新,以支撐企業迅速獲得現況,並調整方向的能力。
  • 高整合性/協調性:不同數據之間必須要能夠思考如何架構的讓他串連在一起,譬如像是線上與線下、不同的數位廣告渠道、網頁訪問與APP等。

建立於這幾個主要目標,我們認為有幾個趨勢是企業能夠逐步落實的:

  1. 將本地伺服器轉移至混合運的部署模式:在絕大多數的環境中,雲端不僅安全性、可擴展性、穩定性都相較於On-Premise來得更優,同時,像是AWS, AZURE, GCP等三家主要的雲端運算提供商,都提供了龐大的數據支援工具,來支援AI的應用,同時像是AWS A3, Google BigQuery這類型的工具更是能實時的支撐大數據的各種應用,微軟的SQL Data Warehouse以及HDInsight也能根據不同的數據類型創造出同樣的結果。
  2. 從All-in-one的解決方案提供商轉移至模組化自建模式:SaaS可以說是近十年間成長最為快速的產業,而這一類型的工具通常會包裝成某一解決方案,專門針對客戶的問題提供相應的解決辦法。但是越來越多的企業發現這樣的部署手段,將整個企業的基礎建設綁在第三方提供商,時長會使許多發展受限。故此,許多業者開始將基礎建設往內移,並透過API的方式,讓各種不同的工具彼此配合、共享數據、同時建立模組化的運營機制, Amazon Sagemaker以及Kubeflow即是在這領域中非常常見的工具。

數據治理(Data Governance)

數據治理是一個管理數據的可用性、有效性、正確性、安全性的流程,其治理的維度通常取決於企業內部所設立的指標,同時還有如客戶資料保護等法遵(Regulation)規範。而不同於數據架構,數據治理通常圍繞在「人」的基礎上設立規範。

數據治理雖然聽起來並不像獲取數據、架構IT、抑或是應用數據一般有如此明確的價值體現,然而有效的數據治理框架,企業將會錯過許多數據驅動的運營模式(出於數據時常尚未清理、不乾淨、錯誤多等),同時相關人員譬如商業分析、AI、以及單純做報告的人員,都會花上大把時間落實數據之清理,使企業不僅浪費資源,同時更是創造許多錯誤發生的機會。

在這些情況中,雖然像是數據湖的架構模式、第三方的軟體解決方案、以及其他能夠在一定程度上提供價值,然而要真正落實數據治理,最終還是取決於所有在整個數據生態系統中擔任角色的人來落實。

簡單來說,企業有幾個思考方向可以參考:

  1. 讓每一個人員清楚每一筆數據的生到死:譬如說,較初期階段的人員(透過系統獲取數據、輸入數據、串連資料等)就應該知道後續這些數據會如何經過哪些流程、如何被架構、如何被團隊應用、如何創造價值等。建立於這一份理解,在整個數據流程中,就會減少許多越走越偏的情況發生,同時有任何異常狀況發生時,團隊也較知道如何應對。而對於應用數據的人來說,清楚的理解這份資料是如何被獲取的,也能協助他們更有效的判斷數據的可依賴性,以及分析的方向,甚至是提供第一線的洞見,讓整個流程前面階段的參與者清楚。
  2. 建立明確的規範與政策:用一個最直接的方式來說,許多人都有在Email上收過修正了無數次的報告,名字可能長這樣「FINAL_Quarterly_Review_3」,這是在版本控制當中,命名倘若沒有落實好治理的規範,往往會出現的狀況,而不止於標題,包含資料庫、紀錄、以及其他。
  3. 建立明確的責任歸屬:「誰做了什麼」,在每一條數據生產線當中,這一個問題都應該要能夠很輕鬆地回答出來,如此將能刺激不管是IT團隊、抑或是應用數據的商業面向的團隊能更注意遵守遊戲規則。

OOSGA Analytics

我們的團隊統合研究、調查以及實務經驗,透過每一次的Insight,分享給台灣決策者相關議題上的思考方式與執行手段。