幾乎所有大企業都面臨著管理數據量、速度和種類的挑戰。在大數據平臺,Hadoop在復雜數據分析能力以及按相對低廉的成本實現大數據擴展性方面提供了一些優勢,同時帶來的挑戰之一就是元數據管理,如果沒有良好的元數據管理和數據治理,Hadoop將會缺乏透明度、可審計性以及數據的標準化與重復利用能力,企業仍將需要對數據相關的關鍵信息如來源、質量和所有權進行可見性管理,否則Hadoop將變成環境內的又一個更大的數據孤島。
數據治理有如下分類,但不是企業內的數據治理需要全部用到,根據實際情況部署一到多個分類治理,達到預期目標即可:
數據治理分類 | ||
數據標準管理 | 標準定義、標準查詢、標準發布 | |
數據質量管理 | 質量規則定義、質量檢查、質量報告 | |
數據集成管理 | 數據處理、數據加工、數據匯集 | 數據血緣 |
數據資產管理 | 數據資產編目、數據資產服務、數據資產審批 | |
數據安全管理 | 數據權限管理、數據脫敏、數據加密 | 數據備份 |
數據歸檔、數據銷毀 | ||
主數據管理 | 主數據申請、主數據發布、主數據分發 |
中易科技在數據治理上的應用案例:通過建立數據資產共享、管控、合作流程和機制,構建數據資產管理平臺,規范數據資產生命周期管理,實現數據可視,提升數據質量和使用效率,減少個人隱私保護風險。