資訊首頁  經(jīng)濟熱點 民營經(jīng)濟 浙江股市 區(qū)域發(fā)展 專業(yè)市場 企業(yè)動態(tài) 統(tǒng)計數(shù)據(jù) 浙江產(chǎn)經(jīng) 浙江樓市

詳解數(shù)據(jù)倉庫技術及相關基本概念

作者: 時間:2019年08月30日 信息來源:

    在了解數(shù)據(jù)倉庫的概念之前,我們需要先來理解一些相關 基礎概念。

    
(1) ETL ( Extract/Transformation/Load, 清洗/轉換/加載):用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗、轉換,最終按照預先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。

    
(2)元數(shù)據(jù):關于數(shù)據(jù)的數(shù)據(jù),指在數(shù)據(jù)倉庫建設過程中所產(chǎn)生的有關數(shù)據(jù)源定義,目標定義,轉換規(guī)則等相關的關鍵數(shù)據(jù)。同時元數(shù)據(jù)還包含關于數(shù)據(jù)含義的商業(yè)信息。典型的元數(shù)據(jù)包括:數(shù)據(jù)倉庫表的結構、數(shù)據(jù)倉庫表的屬性、數(shù)據(jù)倉庫的源數(shù)據(jù)(記錄系統(tǒng))、從記錄系統(tǒng)到數(shù)據(jù)倉庫的映射、數(shù)據(jù)模型的規(guī)格說明、抽取日志和訪問數(shù)據(jù)的公用例行程序等。

    
(3)粒度:數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別。細化程度越高,粒度級就越小;相反,細化程度越低,粒度級就越大。

    
(4)分割:結構相同的數(shù)據(jù)被分成多個數(shù)據(jù)物理單元。任何給定的數(shù)據(jù)單元屬于且僅屬于一個分割。

    
(5)數(shù)據(jù)集市:小型的,面向部門或工作組級數(shù)據(jù)倉庫。

    
(6) ODS (Operation Data Store,操作數(shù)據(jù)存儲):能支持企業(yè)日常的全局應用的數(shù)據(jù)集合,是不同于DB的一種新的數(shù)據(jù)環(huán)境, 是DW打展后得到的一個混合形式。四個 基本特點:面向主題的、 集成的、可變的、當前或接近當前的。

    
(7)數(shù)據(jù)模型:邏輯數(shù)據(jù)結構,包括由數(shù)據(jù)庫管理系統(tǒng)為有效進行數(shù)據(jù)庫處理提供的操作和約束;用于表示數(shù)據(jù)的系統(tǒng)。

    
(8)人工關系:在決策支持系統(tǒng)環(huán)境中用于表示參照完整性的一種 設計技術。

    
傳統(tǒng)的數(shù)據(jù)庫技術在聯(lián)機事務處理中獲得了成功,但是無法滿足隨著市場競爭的加劇而帶來的管理人員對決策分析數(shù)據(jù)提供的要求。傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)中缺乏決策分析所需的大量歷史數(shù)據(jù)信息,因為傳統(tǒng)的數(shù)據(jù)庫一般只保 留當前或近期的數(shù)據(jù)信息。為了滿足中高層管理人員預測、決策分析的需要,在傳統(tǒng)數(shù)據(jù)庫的基礎上產(chǎn)生了能夠滿足預測、決策分析需要的數(shù)據(jù)環(huán)境 數(shù)據(jù)倉庫。

    
數(shù)據(jù)倉庫是一個面向主題的、 集成的、非易失的、且隨時間變化的數(shù)據(jù)集合,用于支持管理決策。
大眾觀點的數(shù)據(jù)倉庫的體系結構如圖1-8所示。

    (1)數(shù)據(jù)源:是數(shù)據(jù)倉庫系統(tǒng)的基礎,是整個系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內部信息和外部信息。內部信息包括存放于關系型數(shù)據(jù)庫管理系統(tǒng)中的各種業(yè)務處理數(shù)據(jù)和各類文檔數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場信息和競爭對手的信息等。

    
(2)數(shù)據(jù)的存儲與管理:是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫的真正關鍵是數(shù)據(jù)的存儲和管理。數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術特點著手分析。針對現(xiàn)有各業(yè)務系統(tǒng)的數(shù)據(jù),進行抽取、清理,并有效集成,按照主題進行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市)。

    
(3) OLAP服務器:對分析需要的數(shù)據(jù)進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。其具體實現(xiàn)可以分為: ROLAP、MOLAP和HOLAP。ROLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放在RDBMS之中; MOLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放于多維數(shù)據(jù)庫中: HOLAP基本數(shù)據(jù)存放于RDBMS之中,聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫中。

    
(4)前端工具:主要包括各種查詢工具、報表工具、分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對OLAP服務器,報表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫。

    

    

  • 0人
  • 1人
最新文章
版權和免責聲明:
1.凡注有“浙江民營企業(yè)網(wǎng)”的文章,均為浙江民營企業(yè)網(wǎng)版權所有,未經(jīng)許可不得轉載或鏡像;
2.未注明來源或轉載自其他媒體的文章,本網(wǎng)轉載出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性;如果您認為文章有可能損害您的利益或知識產(chǎn)權,請與我們聯(lián)系。

關于我們 | About zj123 |法律聲明 | 友情鏈接 | 建議留言 | 網(wǎng)站地圖 | 聯(lián)系我們 | 最新資訊

客服:0571-87896971 客服傳真:0571-87298208 543059767 1091140425

中國電子商務網(wǎng)站百強 © 2002-2012 zj123.com All Rights Reserved

網(wǎng)監(jiān)網(wǎng)監(jiān)

浙ICP備11047537號-1