當前位置:編程學習大全網 - 編程語言 - 什麽是BI工具,ETL工具或OLAP產品?

什麽是BI工具,ETL工具或OLAP產品?

BI

確切地講,BI並不是壹項新技術,它將數據倉庫(DW)、聯機分析處理(OLAP)、數據挖掘(DM)等技術與客戶關系管理(CRM)等結合起來應用於商業活動實際過程當中,實現了技術服務於決策的目的;Mark Hammond從管理的角度看待BI,認為BI是從“根本上幫助妳把公司的運營數據轉化成為高價值的可以獲取的信息(或者知識),並且在恰當的時間通過恰當的手段把恰當的信息傳遞給恰當的人”。

ETL

ETL即數據抽取(Extract)、轉換(Transform)、裝載(Load)的過程。它是構建數據倉庫的重要環節。數據倉庫是面向主題的、集成的、穩定的且隨時間不斷變化的數據集合,用以支持經營管理中的決策制定過程。數據倉庫系統中有可能存在著大量的噪聲數據,引起的主要原因有:濫用縮寫詞、慣用語、數據輸入錯誤、重復記錄、丟失值、拼寫變化等。即便是壹個設計和規劃良好的數據庫系統,如果其中存在著大量的噪聲數據,那麽這個系統也是沒有任何意義的,因為“垃圾進,垃圾出”(garbage in, garbage out),系統根本就不可能為決策分析系統提供任何支持。為了清除噪聲數據,必須在數據庫系統中進行數據清洗。目前有不少數據清洗研究和ETL研究,但是如何在ETL過程中進行有效的數據清洗並使這個過程可視化,此方面研究不多。本文主要從兩個方面闡述ETL和數據清洗的實現過程:ETL的處理方式[19]和數據清洗的實現方法。

聯機事務處理OLTP

聯機分析處理 (OLAP) 的概念最早是由關系數據庫之父E.F.Codd於1993年提出的,他同時提出了關於OLAP的12條準則。OLAP的提出引起了很大的反響,OLAP作為壹類產品同聯機事務處理 (OLTP) 明顯區分開來。

當今的數據處理大致可以分成兩大類:聯機事務處理OLTP(on-line transaction processing)、聯機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統的關系型數據庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數據倉庫系統的主要應用,支持復雜的分析操作,側重決策支持,並且提供直觀易懂的查詢結果。

OLAP是使分析人員、管理人員或執行人員能夠從多角度對信息進行快速、壹致、交互地存取,從而獲得對數據的更深入了解的壹類軟件技術。OLAP的目標是滿足決策支持或者滿足在多維環境下特定的查詢和報表需求,它的技術核心是"維"這個概念。

  • 上一篇:電氣自動化控制維修技術員是幹什麽的
  • 下一篇:怎樣畫思維導圖
  • copyright 2024編程學習大全網