數(shù)據(jù)倉庫的基本結(jié)構(gòu)圖

發(fā)布時(shí)間:2024-03-13
元數(shù)據(jù)元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。數(shù)據(jù)倉庫數(shù)據(jù)庫是整個(gè)數(shù)據(jù)倉庫環(huán)境的核心,是數(shù)據(jù)存放的地方和提供對(duì)數(shù)據(jù)檢索的支持,不過是按照數(shù)據(jù)倉庫的理念去設(shè)計(jì)架構(gòu)和開發(fā)數(shù)據(jù)庫.bi項(xiàng)目主要運(yùn)用數(shù)據(jù)倉庫,詳解數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別數(shù)據(jù)倉庫本身是一個(gè)非常大的數(shù)據(jù)庫,但數(shù)據(jù)倉庫存儲(chǔ)的是由組織作業(yè)數(shù)據(jù)庫中整合而來的數(shù)據(jù);數(shù)據(jù)庫是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉庫是面向主題設(shè)計(jì)的;數(shù)據(jù)庫一般存儲(chǔ)業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)倉庫存儲(chǔ)的一般是歷史數(shù)據(jù);數(shù)據(jù)庫設(shè)計(jì)是盡量避免冗余,一般針對(duì)某一業(yè)務(wù)應(yīng)用進(jìn)行設(shè)計(jì),比如一張簡單的user表,記錄用戶名、密碼等簡單數(shù)據(jù)即可,符合業(yè)務(wù)應(yīng)用,但是不符合分析,數(shù)據(jù)倉庫在設(shè)計(jì)是有意引入冗余,依照分析需求,分析維度、分析指標(biāo)進(jìn)行設(shè)計(jì)。
1、數(shù)據(jù)中心是什么?其系統(tǒng)結(jié)構(gòu)和工作原理是怎樣的呢?數(shù)據(jù)中心是企業(yè)的業(yè)務(wù)系統(tǒng)與數(shù)據(jù)資源進(jìn)行集中、集成、共享、分析的場地、工具、流程等的有機(jī)組合。從應(yīng)用層面看,包括業(yè)務(wù)系統(tǒng)、基于數(shù)據(jù)倉庫的分析系統(tǒng);從數(shù)據(jù)層面看,包括操作型數(shù)據(jù)和分析型數(shù)據(jù)以及數(shù)據(jù)與數(shù)據(jù)的集成/整合流程;從基礎(chǔ)設(shè)施層面看,包括服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)和整體it運(yùn)行維護(hù)服務(wù)。數(shù)據(jù)中心的建設(shè)目標(biāo)是:1、全面建成公司總部和網(wǎng)省公司兩級(jí)數(shù)據(jù)中心,逐步實(shí)現(xiàn)數(shù)據(jù)及業(yè)務(wù)系統(tǒng)的集中;2、建立企業(yè)數(shù)據(jù)倉庫,提供豐富的數(shù)據(jù)分析展現(xiàn)功能;3、實(shí)現(xiàn)數(shù)據(jù)的唯一性與共享性;4、建立統(tǒng)一的安全體系,保證數(shù)據(jù)及業(yè)務(wù)系統(tǒng)的訪問安全;5、結(jié)合數(shù)據(jù)中心建設(shè),完善數(shù)據(jù)交換體系,實(shí)現(xiàn)兩級(jí)數(shù)據(jù)中心間的級(jí)聯(lián);6、實(shí)現(xiàn)網(wǎng)絡(luò)、硬件、存儲(chǔ)設(shè)備、數(shù)據(jù)、業(yè)務(wù)系統(tǒng)和管理流程、it采購流程、數(shù)據(jù)交換流程的統(tǒng)一集中;7、統(tǒng)一的信息管理模式及統(tǒng)一的技術(shù)架構(gòu),能夠迅速地實(shí)施部署各種it系統(tǒng),提升管理能力。
2、etl的體系結(jié)構(gòu)下圖為etl體系結(jié)構(gòu),它體現(xiàn)了主流etl產(chǎn)品框架的主要組成部分。etl是指從源系統(tǒng)中提取數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)為一個(gè)標(biāo)準(zhǔn)的格式,并加載數(shù)據(jù)到目標(biāo)數(shù)據(jù)存儲(chǔ)區(qū),通常是數(shù)據(jù)倉庫。etl體系結(jié)構(gòu)圖designmanager提供一個(gè)圖形化的映射環(huán)境,讓開發(fā)者定義從源到目標(biāo)的映射關(guān)系、轉(zhuǎn)換、處理流程。設(shè)計(jì)過程的各對(duì)象的邏輯定義存儲(chǔ)在一個(gè)元數(shù)據(jù)資料庫中。
etl引擎在運(yùn)行時(shí)和其它應(yīng)用都可參考此資料庫中的元數(shù)據(jù)。extract通過接口提取源數(shù)據(jù),例如jodbc、專用數(shù)據(jù)庫接口和平面文件提取器,并參照元數(shù)據(jù)來決定數(shù)據(jù)的提取及其提取方式。transform開發(fā)者將提取的數(shù)據(jù),按照業(yè)務(wù)需要轉(zhuǎn)換為目標(biāo)數(shù)據(jù)結(jié)構(gòu),并實(shí)現(xiàn)匯總。load加載經(jīng)轉(zhuǎn)換和匯總的數(shù)據(jù)到目標(biāo)數(shù)據(jù)倉庫中,可實(shí)現(xiàn)sql或批量加載。
3、中心數(shù)據(jù)庫設(shè)計(jì)5.2.2.1數(shù)據(jù)庫根據(jù)該系統(tǒng)的開發(fā)需求,按照數(shù)據(jù)庫的功能和作用將其分為風(fēng)險(xiǎn)查詢類、風(fēng)險(xiǎn)評(píng)價(jià)類、系統(tǒng)管理類三大類(薩師煊等,2000)。主要數(shù)據(jù)見表5.5。表5.5海外油氣與金屬礦產(chǎn)資源開發(fā)風(fēng)險(xiǎn)管理系統(tǒng)的主要數(shù)據(jù)表續(xù)表5.2.2.2數(shù)據(jù)倉庫油價(jià)數(shù)據(jù)來源于美國能源部(doe)下屬的能源信息署(eia)網(wǎng)站、中石油(cnpc)網(wǎng)站和《華爾街日?qǐng)?bào)》(wsj)網(wǎng)站提供的油價(jià)數(shù)據(jù),油價(jià)序列本身就是一個(gè)不規(guī)則的時(shí)間序列,油價(jià)數(shù)據(jù)具有以下幾個(gè)特點(diǎn)。
4、什么是數(shù)據(jù)倉庫,數(shù)據(jù)倉庫在哪里保存數(shù)據(jù)。bi項(xiàng)目需要用到哪些技術(shù)數(shù)據(jù)倉庫還是數(shù)據(jù)庫,數(shù)據(jù)還是在數(shù)據(jù)庫里放著呢,不過是按照數(shù)據(jù)倉庫的理念去設(shè)計(jì)架構(gòu)和開發(fā)數(shù)據(jù)庫.bi項(xiàng)目主要運(yùn)用數(shù)據(jù)倉庫,olap,和數(shù)據(jù)挖掘的技術(shù),細(xì)分下來又有主流數(shù)據(jù)庫的開發(fā),如oracle,db2,sqlserver,java,cognos,bo,biee,sas,spss,clementine,weka等等。
5、數(shù)據(jù)倉庫和數(shù)據(jù)庫有什么區(qū)別和聯(lián)系?由于前天聽到一個(gè)說法,集團(tuán)公司需要部署數(shù)據(jù)倉庫及bi的相關(guān)功能,一直以來,據(jù)我了解的是,bi只有在企業(yè)信息化達(dá)到了一定的層次才開始部署的,而且部署bi主要不是以軟件功能為主,而是以企業(yè)建模為主的,因此,就這個(gè)問題,我分別與a工與b顧問進(jìn)行了討論,但得出了不同的結(jié)果,使的我可是越討論越疑惑。其中a工為國內(nèi)某知名分銷軟件的總經(jīng)理,銀行系統(tǒng)出身,是it方面的技術(shù)專家,雖然我自己也是軟件開發(fā)出來的,但對(duì)于他在對(duì)行業(yè)業(yè)務(wù)的了解,對(duì)于軟件開發(fā)、系統(tǒng)架構(gòu)方面的本領(lǐng)可也是佩服的緊的;b顧問也是為國內(nèi)知名的咨詢公司的顧問,博士,認(rèn)識(shí)時(shí)間不長,但也是受教不淺。
6、數(shù)據(jù)倉庫有哪些?數(shù)據(jù)倉庫,英文名稱為datawarehouse,可簡寫為dw或dwh。數(shù)據(jù)倉庫,是為企業(yè)所有級(jí)別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個(gè)數(shù)據(jù)存儲(chǔ),出于分析性報(bào)告和決策支持目的而創(chuàng)建。為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時(shí)間、成本、質(zhì)量以及控制。數(shù)據(jù)倉庫是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。
7、數(shù)據(jù)倉庫三層結(jié)構(gòu)中的組成部分是數(shù)據(jù)倉庫三層數(shù)據(jù)結(jié)構(gòu)的組成是:企業(yè)數(shù)據(jù)模型層;數(shù)據(jù)層(操作型數(shù)據(jù),調(diào)和數(shù)據(jù),導(dǎo)出數(shù)據(jù));元數(shù)據(jù)層(操作型元數(shù)據(jù),調(diào)和數(shù)據(jù)層元數(shù)據(jù),數(shù)據(jù)集市元數(shù)據(jù))。數(shù)據(jù)倉庫數(shù)據(jù)庫是整個(gè)數(shù)據(jù)倉庫環(huán)境的核心,是數(shù)據(jù)存放的地方和提供對(duì)數(shù)據(jù)檢索的支持。相對(duì)于操縱型數(shù)據(jù)庫來說其突出的特點(diǎn)是對(duì)海量數(shù)據(jù)的支持和快速的檢索技術(shù)。數(shù)據(jù)抽取工具把數(shù)據(jù)從各種各樣的存儲(chǔ)方式中拿出來,進(jìn)行必要的轉(zhuǎn)化、整理,再存放到數(shù)據(jù)倉庫內(nèi)。
數(shù)據(jù)轉(zhuǎn)換都包括,刪除對(duì)決策應(yīng)用沒有意義的數(shù)據(jù)段;轉(zhuǎn)換到統(tǒng)一的數(shù)據(jù)名稱和定義;計(jì)算統(tǒng)計(jì)和衍生數(shù)據(jù);給缺值數(shù)據(jù)賦給缺省值;把不同的數(shù)據(jù)定義方式統(tǒng)一。元數(shù)據(jù)元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)??蓪⑵浒从猛镜牟煌譃閮深悾夹g(shù)元數(shù)據(jù)和商業(yè)元數(shù)據(jù)。技術(shù)元數(shù)據(jù)是數(shù)據(jù)倉庫的設(shè)計(jì)和管理人員用于開發(fā)和日常管理數(shù)據(jù)倉庫是用的數(shù)據(jù)。
8、詳解數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別數(shù)據(jù)倉庫本身是一個(gè)非常大的數(shù)據(jù)庫,但數(shù)據(jù)倉庫存儲(chǔ)的是由組織作業(yè)數(shù)據(jù)庫中整合而來的數(shù)據(jù);數(shù)據(jù)庫是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉庫是面向主題設(shè)計(jì)的;數(shù)據(jù)庫一般存儲(chǔ)業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)倉庫存儲(chǔ)的一般是歷史數(shù)據(jù);數(shù)據(jù)庫設(shè)計(jì)是盡量避免冗余,一般針對(duì)某一業(yè)務(wù)應(yīng)用進(jìn)行設(shè)計(jì),比如一張簡單的user表,記錄用戶名、密碼等簡單數(shù)據(jù)即可,符合業(yè)務(wù)應(yīng)用,但是不符合分析,數(shù)據(jù)倉庫在設(shè)計(jì)是有意引入冗余,依照分析需求,分析維度、分析指標(biāo)進(jìn)行設(shè)計(jì)。
上一個(gè):名茶的故鄉(xiāng):西南茶區(qū)
下一個(gè):惠普打印機(jī)不走紙是什么情況(打印機(jī)不走紙是什么情況呢)

紅頭文件的紅頭怎么做(紅頭文件的制作流程)
雨露清茶 洗去一身鉛華
白芍的功效與作用
提高直讀光譜儀成分分析準(zhǔn)確性的方法
材料扭轉(zhuǎn)試驗(yàn)機(jī)的保養(yǎng)和注意事項(xiàng),都給大家總結(jié)了
域名郵箱是什么?個(gè)人如何開通域名郵箱?
顯卡驅(qū)動(dòng)更新老是失敗(顯卡驅(qū)動(dòng)程序更新安裝失敗)
筆記本電腦開機(jī)密碼忘記了怎么辦,華為筆記本電腦開機(jī)密碼忘記了怎么辦
與普洱茶的歲月
造價(jià)中趕工措施費(fèi)的計(jì)取問題
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos