數據安全:元數據管理分步指南
需要元數據管理
組織中有效的元數據管理為數據提供正確的上下文和描述。此外,為了理解和信任數據,需要了解其背景——數據是如何產生的,以及是如何使用的。此外,需要知道基于這些數據做出的決策是什么,以及如何利用它來獲得更好的競爭優勢。
為了在這個新的數字時代取得成功,組織需要創建細致的數據產品。數據產品不僅僅是報告或分析,而是一個全面的解決方案。在正確的時間和正確的設備上向正確的人提供分析、比較、富有洞察力的信息。
如果沒有完整的元數據管理解決方案,就很難創建這些數據產品。隨著數據量的增長和大數據技術的爆炸式增長,CDO(首席數據官)必須著眼于通過元數據更有效地管理其數據。根據最新估計,到
2022 年,元數據管理行業規模將達到 78.5 億左右,并且將逐年增長 27%。
什么是元數據?
元數據是“提供有關其他數據的信息的數據[信息]。這種理解來自于在上下文中設置數據,允許被重用和檢索以用于多種業務用途和時間。”根據印度大學,
“元數據是關于數據的數據,是關于特定數據集、對象或資源的描述性信息,包括其格式、收集時間和收集者。雖然元數據最常見的是指網絡資源,但也可以是物理或電子資源。可以使用軟件自動創建或手動輸入。”
結構化或結構化的一些典型元數據元素非結構化數據是: 標題、描述和摘要;標簽和類別;創建時間和創建者;最后修改者和時間;誰可以訪問或更新。
除此之外,組織中的元數據分類為:
結構化數據的元數據
包括數據庫表的列結構、CSV 文件的標題行、來自 JSON、XML 和 Avro 文件的列定義。
業務元數據
包括安全級別、隱私級別和首字母縮寫詞級別。IT
和業務都需要高質量的元數據來理解手頭的信息。如果沒有有用的元數據,組織就有根據錯誤數據做出錯誤決策的風險。
什么是元數據管理?
圖書館目錄是元數據管理的經典和最古老的例子之一。查找用于在圖書館目錄中查找書籍作者或主題并搜索所需書籍的書籍。接下來是雅虎!搜索引擎,在其中索引了來自各個網站的所有元數據。最后,當谷歌通過處理實際數據來設計元數據時,革命發生了。
為用戶提供了前所未有的深入搜索體驗,使用戶能夠在所需的上下文中進行搜索。然而,企業元數據管理仍處于圖書館目錄級別(手動完成)或 Yahoo
級別(通過使用各種元數據管理產品完成)。
一個理想的元數據管理程序應該是數據驅動的并從上下文中派生出來。提供所有常見問題的答案,例如關于數據的人、內容、時間、地點和原因是元數據管理。
應該如何進行有效的 MDM?
以下是確保它的幾個步驟:
布局政策和程序
有效的元數據管理始于元數據的政策、程序、工具和人工管理。員工是元數據管理的中心。公司必須有工具讓員工之間就數據和元數據進行順暢的交互。以下應該是有效元數據管理的角色:
CDO 和高管的角色
定義元數據管理規則,并使用一些工具來執行它們。這些規則應包括各種安全方面和元數據更改方法。
分析師和其他數據公民的角色
分析師應遵循元數據管理規則。此外,如果他們詢問有關數據和元數據的深刻問題,這些問題和評論可以被保存。稍后,這可以使其他分析師在研究相同數據時受益。
MDM 工具的功能
應該有強大的工具來提供對元數據的訪問,并且它們應該執行高管定義的所有規則。這些工具可以提供的一些功能包括:
- 樣本數據
在這里,我們在生成樣本數據的數據上打開表格,為元數據提供數據上下文。因此,我們豐富了我們對元數據的理解。
- 數據統計(配置文件)
統計信息提供了一些常見問題的答案,例如計數、不同值、最常用的值、空計數、最大值和最小值。
- 血統
能夠幫助了解數據的來源、傳輸方式以及在數據到達之前發生的各種轉換。此外,能夠了解這些數據的其他用途。
- 以前的溝通
溝通是有效元數據管理的關鍵,因此將所有與元數據相關的對話集中在一個地方很重要。此外,有關該元數據的所有評論和評論也應在此處提供。
- 與其他元數據的關系
對于 MDM
工具來說,找到數據之間的關系以使數據搜索成為可能至關重要。有多種方法可以實現這一點——手動、人工管理、通過元數據語義匹配自動或通過數據匹配自動。