1,如何構(gòu)建bi數(shù)據(jù)倉庫以及bi數(shù)據(jù)分析的應(yīng)用2,請問數(shù)據(jù)倉庫都用什么建立3,想做數(shù)據(jù)倉庫以前做java的有什么好的建議嗎0基礎(chǔ)感覺 問4,關(guān)于數(shù)據(jù)倉庫的設(shè)計(jì)5,數(shù)據(jù)倉庫的實(shí)現(xiàn)策略1,如何構(gòu)建bi數(shù)據(jù)倉庫以及bi數(shù)據(jù)分析的應(yīng)用
首先通過etl工具抽取轉(zhuǎn)換加載數(shù)據(jù)到數(shù)據(jù)倉庫dw,按主題形成數(shù)據(jù)集市dw,最后通過報(bào)表展現(xiàn)數(shù)據(jù)。mircosoft ssisinformaticadatastage比較流行和常用的etl工具,可以到網(wǎng)上收集資料
2,請問數(shù)據(jù)倉庫都用什么建立
數(shù)據(jù)倉庫是為了管理數(shù)據(jù),主要是思想。具體實(shí)施的工具就是為了解決問題而選取了比如異構(gòu)/不同源數(shù)據(jù)的數(shù)據(jù)抽取問題,要用到etl,可能會(huì)用工具 或者自己寫程序,看情況而定數(shù)據(jù)倉庫的模型建設(shè),要用到erwin等建模工具;數(shù)據(jù)的存放一般是借助關(guān)系數(shù)據(jù)庫來實(shí)現(xiàn),那么會(huì)用到oracle之類。不過現(xiàn)在已經(jīng)開始慢慢摒棄傳統(tǒng)關(guān)系數(shù)據(jù)庫了,借助一些no sql平臺(tái),比如hadoop上的hive之類。不過無論用什么工具,一定要記住,數(shù)據(jù)倉庫的思想是不變的,就是管理數(shù)據(jù)、把數(shù)據(jù)的價(jià)值通過有效地管理而展現(xiàn)出來,不經(jīng)管理的數(shù)據(jù)就是一堆沒有提煉的金礦,看著很值錢,直接狗屁用沒有。
3,想做數(shù)據(jù)倉庫以前做java的有什么好的建議嗎0基礎(chǔ)感覺 問
當(dāng)然是j2ee有發(fā)展,數(shù)據(jù)倉庫(不包括數(shù)據(jù)挖掘)這種東西說白了就是把老外的工具拿來用用爾亦。它的創(chuàng)造性遠(yuǎn)不及java c++等,而且數(shù)據(jù)倉庫是與需求緊密相連的,也就是說它的知識(shí)不具有“可復(fù)用性”。對于謀生來說,可能現(xiàn)階段數(shù)據(jù)倉庫容易些,好騙人。有如此好的java背景,為什么不找個(gè)相關(guān)的工作呢?我現(xiàn)在在搞所謂的數(shù)據(jù)倉庫,但個(gè)人最熱衷的是設(shè)計(jì)模式以及j2ee等比較有意思的東西。早晚我會(huì)從事那樣的工作,即比較底層的東西。從另外一個(gè)角度看,你搞一搞數(shù)據(jù)倉庫也沒有什么不好,sun不是也在指定用于olap和數(shù)據(jù)挖掘的規(guī)范嗎?銀行比較好,數(shù)據(jù)倉庫比java前途好吧。根據(jù)個(gè)人愛好仔細(xì)斟酌,錢多少看自己以后發(fā)展。
4,關(guān)于數(shù)據(jù)倉庫的設(shè)計(jì)
合并也不可能在系統(tǒng)一級(jí)上這么快合并,而是通過慢慢淘汰更新,用新系統(tǒng)替換舊系統(tǒng)。在數(shù)據(jù)的統(tǒng)計(jì)分析應(yīng)用上,也不會(huì)這么快就有一個(gè)table或兩個(gè)table的定論,都要看情況。產(chǎn)品與客戶都是維表,事實(shí)表是要體現(xiàn)業(yè)務(wù)的,要基于具體業(yè)務(wù)來設(shè)計(jì)。這個(gè)你提供的信息太少了,要具體情況具體分析,不過未來兩個(gè)公司的業(yè)務(wù)肯定都是合并的,你的產(chǎn)品和客戶最終都要合并,所以 客戶和產(chǎn)品作為維度肯定要合并。而你的事實(shí)表,要看情況,你是什么行業(yè),你的業(yè)務(wù)簡單(業(yè)務(wù)系統(tǒng)少),產(chǎn)品少,交易簡單數(shù)據(jù)量小,那么事實(shí)表就數(shù)據(jù)量少,反之則根據(jù) 交易類型或產(chǎn)品進(jìn)行事實(shí)表的拆分例如銀行就按 卡、存款、對公、對私 業(yè)務(wù) 有不同的事實(shí)表
5,數(shù)據(jù)倉庫的實(shí)現(xiàn)策略
數(shù)據(jù)倉庫的開發(fā)策略主要有自頂向下、自底向上和這兩種策略的聯(lián)合使用。自頂向下策略在實(shí)際應(yīng)用中比較困難,因?yàn)閿?shù)據(jù)倉庫的功能是一種決策支持功能。這種功能在企業(yè)戰(zhàn)略的應(yīng)用范圍中常常是很難確定的,因?yàn)閿?shù)據(jù)倉庫的應(yīng)用機(jī)會(huì)往往超出企業(yè)當(dāng)前的實(shí)際業(yè)務(wù)范圍,而且在開發(fā)前就確定目標(biāo),會(huì)在實(shí)現(xiàn)預(yù)定目標(biāo)后就不再追求新的應(yīng)用,是數(shù)據(jù)倉庫喪失更有戰(zhàn)略意義的應(yīng)用。由于該策略在開發(fā)前就可以給出數(shù)據(jù)倉庫的實(shí)現(xiàn)范圍,能夠清楚地向決策者和企業(yè)描述系統(tǒng)的收益情況和實(shí)現(xiàn)目標(biāo),因此是一種有效的數(shù)據(jù)倉庫開發(fā)策略。該方法使用時(shí)需要開發(fā)人員具有豐富的自頂向下開發(fā)系統(tǒng)的經(jīng)驗(yàn),企業(yè)決策層和管理人員完全知道數(shù)據(jù)倉庫的預(yù)定目標(biāo)并且了解數(shù)據(jù)倉庫能夠在那些決策中發(fā)揮作用。自底向上策略一般從某個(gè)數(shù)據(jù)倉庫原型開始,選擇一些特定的為企業(yè)管理人員所熟知的管理問題作為數(shù)據(jù)倉庫開發(fā)的對象,在此基礎(chǔ)上進(jìn)行數(shù)據(jù)倉庫的開發(fā)。因此,該策略常常用于一個(gè)數(shù)據(jù)集市、一個(gè)經(jīng)理系統(tǒng)或一個(gè)部門的數(shù)據(jù)倉庫開發(fā)。該策略的優(yōu)點(diǎn)在于企業(yè)能夠以較小的投入,獲得較高的數(shù)據(jù)倉庫應(yīng)用收益。在開發(fā)過程中,人員投入較少,也容易獲得成效。當(dāng)然,如果某個(gè)項(xiàng)目的開發(fā)失敗可能造成企業(yè)整個(gè)數(shù)據(jù)倉庫系統(tǒng)開發(fā)的延遲。該策略一般用于企業(yè)洗碗對數(shù)據(jù)倉庫的技術(shù)進(jìn)行評價(jià),以確定該技術(shù)的應(yīng)用方式、地點(diǎn)和時(shí)間,或希望了解實(shí)現(xiàn)和運(yùn)行數(shù)據(jù)倉庫所需要的各種費(fèi)用,或在數(shù)據(jù)倉庫的應(yīng)用目標(biāo)并不是很明確時(shí),數(shù)據(jù)倉庫對決策過程影響不是很明確時(shí)使用。在自頂向下的開發(fā)策略中可以采用結(jié)構(gòu)化或面向?qū)ο蟮姆椒?,按照?shù)據(jù)倉庫的規(guī)劃、需求確定、系統(tǒng)分析、系統(tǒng)設(shè)計(jì)、系統(tǒng)集成、系統(tǒng)測試和系統(tǒng)試運(yùn)行的階段完成數(shù)據(jù)倉庫的開發(fā)。而在自底向上的開發(fā)中,則可以采用螺旋式的原型開發(fā)方法,使用戶可以根據(jù)新的需求對試運(yùn)行的系統(tǒng)進(jìn)行修改。螺旋式的原型開發(fā)方法要求在較短的時(shí)間內(nèi)快速的生成可以不斷增加功能的數(shù)據(jù)倉庫系統(tǒng),這種開發(fā)方法主要適合于這樣一些場合:在企業(yè)的市場動(dòng)向和需求無法預(yù)測,市場的時(shí)機(jī)是實(shí)現(xiàn)產(chǎn)品的重要組成部分,不斷地改進(jìn)對與企業(yè)的市場調(diào)節(jié)是必需的;持久的競爭優(yōu)勢來自連續(xù)不斷地改進(jìn),系統(tǒng)地改進(jìn)是基于用戶在使用中的不斷發(fā)現(xiàn)。自頂向下和自底向上策略的聯(lián)合使用具有兩種策略的優(yōu)點(diǎn),既能快速的完成數(shù)據(jù)倉庫的開發(fā)與應(yīng)用,還可建立具有長遠(yuǎn)價(jià)值的數(shù)據(jù)倉庫方案。但在實(shí)踐中往往難以操作,通常需要能夠建立、應(yīng)用和維護(hù)企業(yè)模型、數(shù)據(jù)模型和技術(shù)結(jié)構(gòu)的、具有豐富經(jīng)驗(yàn)的開發(fā)人員,能夠熟練的從具體(如業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù))轉(zhuǎn)移到抽象(只基于業(yè)務(wù)性質(zhì)而不是基于實(shí)現(xiàn)系統(tǒng)技術(shù)的邏輯模型);企業(yè)需要擁有由最終用戶和信息系統(tǒng)人員組成的有經(jīng)驗(yàn)的開發(fā)小組,能夠清楚地指出數(shù)據(jù)倉庫在企業(yè)戰(zhàn)略決策支持中的應(yīng)用。目前,大家公認(rèn)的數(shù)據(jù)倉庫創(chuàng)始人w h.inmon在他所著的《建立數(shù)據(jù)倉庫》一書中對數(shù)據(jù)倉庫所下的定義;數(shù)據(jù)倉庫就是面向主題的、集成的、穩(wěn)定的、不同時(shí)間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。數(shù)據(jù)倉庫中的數(shù)據(jù)面向主題與傳統(tǒng)的數(shù)據(jù)庫面向應(yīng)用相對應(yīng)。主題是一個(gè)在較高層次將數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題對應(yīng)一個(gè)宏觀的分析領(lǐng)域。數(shù)據(jù)倉庫的集成特性是指在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須進(jìn)行數(shù)據(jù)加丁一和集成,這是建立數(shù)據(jù)倉庫的關(guān)鍵步驟,首先要統(tǒng)一原始數(shù)據(jù)中的矛盾之處,還要將原始數(shù)據(jù)結(jié)構(gòu)做一個(gè)從面向應(yīng)用向面向主題的轉(zhuǎn)變,數(shù)據(jù)倉庫的穩(wěn)定性是指數(shù)據(jù)倉庫反映的是歷史數(shù)據(jù)的內(nèi)容,而不是日常事務(wù)處理產(chǎn)生的數(shù)據(jù),數(shù)據(jù)經(jīng)加工和集成進(jìn)入數(shù)據(jù)倉庫后是很少修改或根本不修改的;數(shù)據(jù)倉庫是不同時(shí)間的數(shù)據(jù)集合,它要求數(shù)據(jù)倉庫中的數(shù)據(jù)保存時(shí)限能滿足進(jìn)行決策分析的需要,而且數(shù)據(jù)倉庫中的數(shù)據(jù)都要標(biāo)明該數(shù)據(jù)的歷史時(shí)期。 數(shù)據(jù)倉庫最根本的特點(diǎn)是物理地存放數(shù)據(jù),而且這些數(shù)據(jù)并不是最新的、專有的,而是來源于其他數(shù)據(jù)庫,它要建立在一個(gè)較全面和完善的信息應(yīng)用的基礎(chǔ)上,用于支持高層決策分析,而事務(wù)處理數(shù)據(jù)庫在企業(yè)的信息環(huán)境!!,承擔(dān)的是日常操作性的任務(wù),數(shù)據(jù)倉庫是數(shù)據(jù)庫技術(shù)的一種新的應(yīng)用,到目前為止,數(shù)據(jù)倉庫還是用數(shù)據(jù)庫管理系統(tǒng)來管理其中的數(shù)據(jù)。