數據治理和數據管理
簡單來說治理就是管理的管理。
管理妳得遵循壹定得標準規範體系,壹定得流程,壹定得組織角色分工,而這些內容就必須先通過數據治理定義清楚。管理只是根據數據治理規範體系去執行管理和監督得職責。
既管理執行得依據是治理規範體系。
數據中臺和數據湖
這個要解釋清楚不太容易,因此我盡量做簡化。
數據湖壹般是公有雲服務商提出得壹個概念,即企業得結構化,非結構化數據都可以全部采集和存儲到我這裏來。數據湖就是壹個大得存儲站,這個存儲是分布式可無限擴展得,存儲過來得數據也不會去清洗和加工,盡量保持原樣。
在存過來後,數據湖再提供壹些標準得開放接口給妳使用數據,這些接口包括了查詢SQL類接口,計算引擎接口,流處理接口等。提供接口得目的也很簡單,妳能夠方便得使用妳存儲過來得數據。
數據湖得存儲壹般是分布式對象存儲或分布式文件存儲,即使妳是結構化數據庫采集過來得數據,仍然會轉成統壹的存儲方法,方便擴展。
數據中臺簡單來說企業***享數據能力下沈並對外開放。
數據中臺包括了底層數據技術平臺(可以是我們熟悉的大數據平臺能力),中間的數據資產層,上層的數據對外能力開放。
核心的資產層本身也分層,從最底層的貼源數據,到分域應用數據,再到上層的數據倉庫和數據標簽庫。而數據湖更多對應到數據中臺概念裏面的數據貼源層。
企業實際在建數據中臺的時候實際很少用數據湖這個概念。
兩者的對比映射如下:
數據中心
對於數據中心這個詞,原來在BI系統應用裏面也經常出現。
但是現在數據中心壹般特指IT基礎設施,大的公有雲數據機房等,在BI系統或數據中臺裏面都很少用這個詞。即數據中心這個詞偏IT硬件基礎設施層面了。