數(shù)據(jù)倉庫建模,什么是數(shù)據(jù)庫建模

發(fā)布時間:2024-03-19
1,什么是數(shù)據(jù)庫建模2,數(shù)據(jù)倉庫的模型有哪些3,數(shù)據(jù)倉庫建模星型模型大致了解就是事實表對應(yīng)許多維表對雪花4,數(shù)據(jù)倉庫的星型模型的事實表和維表的設(shè)計5,如何建立和評估數(shù)據(jù)倉庫邏輯模型1,什么是數(shù)據(jù)庫建模 數(shù)據(jù)庫模型一般有3個,前兩個幾乎已經(jīng)淘汰了,我們現(xiàn)在用的是第3代了,叫“關(guān)系數(shù)據(jù)庫”,用er圖來表示各個元素之間的關(guān)系,er就是entity-relationship的縮寫。搞這個東西,要有高等數(shù)學(xué)和離散數(shù)學(xué)做基礎(chǔ)。離散數(shù)學(xué)不行的話,搞高層次的東西就不行了。
2,數(shù)據(jù)倉庫的模型有哪些 1、星型模型 星型模型是一種由一點向外輻射的建模范例,中間有一單一對象沿半徑向外連接到多個對象。星型模型反映了最終用戶對商務(wù)查詢的看法:銷售事實、賠償、付款和貨物的托運都用一維或多維描述(按月、產(chǎn)品、地理位置)。星型模型中心的對象稱為“事實表”,與之相連的對象稱為“維表”。對事實表的查詢就是獲取指向維表的指針表,當(dāng)對事實表的查詢與對維表的查詢結(jié)合在一起時,就可以檢索大量的信息。通過聯(lián)合,維表可以對查找標(biāo)準(zhǔn)細(xì)剖和聚集。2、雪花模型 雪花模型是對星型模型的擴展,每一個點都沿半徑向外連接到多個點.雪花模型對星型的維表進(jìn)一步標(biāo)準(zhǔn)化,它的優(yōu)點是通過最大限度的減少數(shù)據(jù)存儲量以及把較小的標(biāo)準(zhǔn)化表(而不是大的非標(biāo)準(zhǔn)化表)聯(lián)合在一起來改善查詢性能?;熬S的較低的粒度,雪花模型增加了應(yīng)用程序的靈活性。3、混合模型 混合模型是星型模型和雪花模型的一種折衷模式,其中星型模型由事實表和標(biāo)準(zhǔn)化的維表組成,雪花模型的所有維表都進(jìn)行了標(biāo)準(zhǔn)化。在混合模型中,只有最大的維表才進(jìn)行標(biāo)準(zhǔn)化,這些表一般包含一列列完全標(biāo)準(zhǔn)化的(重復(fù)的)數(shù)據(jù)?!钡臓幷撘恢睕]有休止,這個問題同時也是企業(yè)在建立dw時需要決策的關(guān)鍵問題。bill inmon的集線器架構(gòu)/企業(yè)信息工廠架構(gòu)(hub and spoke / cif – corporate information factory)與ralph kimball的數(shù)據(jù)集市/數(shù)據(jù)倉庫總線架構(gòu)(data mart bus architecture/data warehouse bus architecture)則是dw架構(gòu)的爭論焦點。但是,這些爭論一直無法形成統(tǒng)一的結(jié)論。到底哪種dw架構(gòu)最好,不同的bi/dw從業(yè)者在不同的項目中,面對不同企業(yè)的不同情況時,往往持有不同的說法。2005 年,thilini ariyachandra 與hugh watson針對dw架構(gòu)做了一個深入的調(diào)查,調(diào)查題目為“哪種數(shù)據(jù)倉庫最成功?”,受訪者由454位曾在各種不同規(guī)模的企業(yè)(絕大多數(shù)是美國企業(yè))中參與了dw規(guī)劃與實施的人員組成,受訪者根據(jù)dw應(yīng)用實際情況及經(jīng)驗體會做出回答。為了合理設(shè)計調(diào)查問卷,在調(diào)查問卷中合理設(shè)置調(diào)查對象(參與調(diào)查的dw架構(gòu))和評判標(biāo)準(zhǔn)(影響dw架構(gòu)選擇的因素及判斷dw架構(gòu)成功的因素等)等內(nèi)容,watson和ariyachandra邀請了20位專家組成專家組設(shè)計調(diào)查問卷及判斷標(biāo)準(zhǔn)等,這20位專家包括了dw領(lǐng)域的兩位先驅(qū)——赫赫有名的bill inmon和ralph kimball。因此我們可以認(rèn)為這份調(diào)查的結(jié)果是權(quán)威可信的。
3,數(shù)據(jù)倉庫建模星型模型大致了解就是事實表對應(yīng)許多維表對雪花 詳細(xì)和你說一下星型模型和雪花模型 星型模式 vs 雪花模型多維數(shù)據(jù)建模以直觀的方式組織數(shù)據(jù),并支持高性能的數(shù)據(jù)訪問。每一個多維數(shù)據(jù)模型由多個多維數(shù)據(jù)模式表示,每一個多維數(shù)據(jù)模式都是由一個事實表和一組維表組成的。多維模型最常見的是星形模式。在星形模式中,事實表居中,多個維表呈輻射狀分布于其四周,并與事實表連接。在星型的基礎(chǔ)上,發(fā)展出雪花模式,下面就二者的特點做比較。 星型模式位于星形中心的實體是指標(biāo)實體,是用戶最關(guān)心的基本實體和查詢活動的中心,為數(shù)據(jù)倉庫的查詢活動提供定量數(shù)據(jù)。每個指標(biāo)實體代表一系列相關(guān)事實,完成一項指定的功能。位于星形圖星角上的實體是維度實體,其作用是限制用戶的查詢結(jié)果,將數(shù)據(jù)過濾使得從指標(biāo)實體查詢返回較少的行,從而縮小訪問范圍。每個維表有自己的屬性,維表和事實表通過關(guān)鍵字相關(guān)聯(lián)。星形模式雖然是一個關(guān)系模型,但是它不是一個規(guī)范化的模型。在星形模式中,維度表被故意地非規(guī)范化了,這是星形模式與oltp系統(tǒng)中的關(guān)系模式的基本區(qū)別。使用星形模式主要有兩方面的原因:提高查詢的效率。采用星形模式設(shè)計的數(shù)據(jù)倉庫的優(yōu)點是由于數(shù)據(jù)的組織已經(jīng)過預(yù)處理,主要數(shù)據(jù)都在龐大的事實表中,所以只要掃描事實表就可以進(jìn)行查詢,而不必把多個龐大的表聯(lián)接起來,查詢訪問效率較高。同時由于維表一般都很小,甚至可以放在高速緩存中,與事實表作連接時其速度較快;便于用戶理解。對于非計算機專業(yè)的用戶而言,星形模式比較直觀,通過分析星形模式,很容易組合出各種查詢??偨Y(jié):非正規(guī)化;多維數(shù)據(jù)集中的每一個維度都與事實表連接(通過主鍵和外鍵);不存在漸變維度;有冗余數(shù)據(jù);查詢效率可能會比較高;不用過多考慮正規(guī)化因素,設(shè)計維護(hù)較為簡單。 雪花模式 在實際應(yīng)用中,隨著事實表和維表的增加和變化,星形模式會產(chǎn)生多種衍生模式,包括星系模式、星座模式、二級維表和雪花模式。雪花模式是對星形模式維表的進(jìn)一步層次化,將某些維表擴展成事實表,這樣既可以應(yīng)付不同級別用戶的查詢,又可以將源數(shù)據(jù)通過層次間的聯(lián)系向上綜合,最大限度地減少數(shù)據(jù)存儲量,因而提高了查詢功能。雪花模式的維度表是基于范式理論的,因此是界于第三范式和星形模式之間的一種設(shè)計模式,通常是部分?jǐn)?shù)據(jù)組織采用第三范式的規(guī)范結(jié)構(gòu),部分?jǐn)?shù)據(jù)組織采用星形模式的事實表和維表結(jié)構(gòu)。在某些情況下,雪花模式的形成是由于星形模式在組織數(shù)據(jù)時,為減少維表層次和處理多對多關(guān)系而對數(shù)據(jù)表進(jìn)行規(guī)范化處理后形成的。雪花模式的優(yōu)點是:在一定程度上減少了存儲空間;規(guī)范化的結(jié)構(gòu)更容易更新和維護(hù)。同樣雪花模式也存在不少缺點:雪花模式比較復(fù)雜,用戶不容易理解;瀏覽內(nèi)容相對困難;額外的連接將使查詢性能下降。在數(shù)據(jù)倉庫中,通常不推薦“雪花化”。因為在數(shù)據(jù)倉庫中,查詢性能相對oltp系統(tǒng)來說更加被重視,而雪花模式會降低數(shù)據(jù)倉庫系統(tǒng)的性能。總結(jié):正規(guī)化;數(shù)據(jù)冗余少;有些數(shù)據(jù)需要連接才能獲取,可能效率較低;規(guī)范化操作較復(fù)雜,導(dǎo)致設(shè)計及后期維護(hù)復(fù)雜;實際應(yīng)用中,可以采取上述兩種模型的混合體:如:中間層使用雪花結(jié)構(gòu)以降低數(shù)據(jù)冗余度,數(shù)據(jù)集市部分采用星型以方便數(shù)據(jù)提取及和分析。 有時候規(guī)范化和效率是一組矛盾。一般我們會采取犧牲空間(規(guī)范化)來換取好的性能,把盡可能多的維度信息存在一張“大表”里面是最快的。通常會視情況而定,采取折中的策略。 星型有時會造成數(shù)據(jù)大量冗余,并且很有可能將事實表變的及其臃腫(上百萬條數(shù)據(jù)×上百個維度)。 每次遇到需要更新維度成員的情況時,都必須連事實表也同時更新。 而雪花型,有時只需要更新雪花維度中的一層即可,無需更改龐大的事實表。 具體問題具體分析,如時間維度,年,季就沒必要做雪花,而涉及到產(chǎn)品和產(chǎn)品的分類,如果分類信息也是我們需要分析的信息,那么,我肯定是建關(guān)于分類的查找表,也就是采用雪花模式 雪花型結(jié)構(gòu)是一種正規(guī)化結(jié)構(gòu),他取除了數(shù)據(jù)倉庫中的冗余數(shù)據(jù)。比如有一張銷售事實表,然后有一張產(chǎn)品維度表與之相連,然后有一張產(chǎn)品類別維度表與產(chǎn)品維度表連。這種結(jié)構(gòu)就是雪花型結(jié)構(gòu)。雪花型結(jié)構(gòu)取除了數(shù)據(jù)冗余,所以有些統(tǒng)計就需要做連接才能產(chǎn)生,所以效率不一定有星型架構(gòu)高。正規(guī)化也是一種比較復(fù)雜的過程,相應(yīng)數(shù)據(jù)庫結(jié)構(gòu)設(shè)計、數(shù)據(jù)的etl、以及后期的維護(hù)都要復(fù)雜一些。 星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu),多維數(shù)據(jù)集中的每一個維度都與事實表相連接,不存在漸變維度,所以數(shù)據(jù)有一定的冗余,正因為數(shù)據(jù)的冗余所以很多統(tǒng)計查詢不需要做外部的連接所以一般情況下效率比雪花型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素,設(shè)計與實現(xiàn)都比較簡單。 雖然兩種結(jié)構(gòu)有一定差別,我個人認(rèn)為沒有好壞之分,最主要的還是看項目的需求,看業(yè)務(wù)邏輯。
4,數(shù)據(jù)倉庫的星型模型的事實表和維表的設(shè)計 這個不難吧,維表不用想啦,表結(jié)構(gòu)直接按照你說的那些信息做就可以了;銷售事實表的結(jié)構(gòu):產(chǎn)品外鍵,日期外鍵,客戶外鍵,銷售代理外鍵,銷售量,銷售價,成本,銷售金額,利潤;星型模型就是以銷售事實表為中心,使用維度外鍵與各個維度相連就可以了。詳細(xì)和你說一下星型模型和雪花模型星型模式 vs 雪花模型多維數(shù)據(jù)建模以直觀的方式組織數(shù)據(jù),并支持高性能的數(shù)據(jù)訪問。每一個多維數(shù)據(jù)模型由多個多維數(shù)據(jù)模式表示,每一個多維數(shù)據(jù)模式都是由一個事實表和一組維表組成的。多維模型最常見的是星形模式。在星形模式中,事實表居中,多個維表呈輻射狀分布于其四周,并與事實表連接。在星型的基礎(chǔ)上,發(fā)展出雪花模式,下面就二者的特點做比較。 星型模式位于星形中心的實體是指標(biāo)實體,是用戶最關(guān)心的基本實體和查詢活動的中心,為數(shù)據(jù)倉庫的查詢活動提供定量數(shù)據(jù)。每個指標(biāo)實體代表一系列相關(guān)事實,完成一項指定的功能。位于星形圖星角上的實體是維度實體,其作用是限制用戶的查詢結(jié)果,將數(shù)據(jù)過濾使得從指標(biāo)實體查詢返回較少的行,從而縮小訪問范圍。每個維表有自己的屬性,維表和事實表通過關(guān)鍵字相關(guān)聯(lián)。星形模式雖然是一個關(guān)系模型,但是它不是一個規(guī)范化的模型。在星形模式中,維度表被故意地非規(guī)范化了,這是星形模式與oltp系統(tǒng)中的關(guān)系模式的基本區(qū)別。使用星形模式主要有兩方面的原因:提高查詢的效率。采用星形模式設(shè)計的數(shù)據(jù)倉庫的優(yōu)點是由于數(shù)據(jù)的組織已經(jīng)過預(yù)處理,主要數(shù)據(jù)都在龐大的事實表中,所以只要掃描事實表就可以進(jìn)行查詢,而不必把多個龐大的表聯(lián)接起來,查詢訪問效率較高。同時由于維表一般都很小,甚至可以放在高速緩存中,與事實表作連接時其速度較快;便于用戶理解。對于非計
上一個:孕婦被撞后沒事要賠償嗎?
下一個:硬盤pcie,固態(tài)硬盤支持pcie嗎

什么是半導(dǎo)體
下列工程需由施工單位組織進(jìn)行專家論證
德國ott液位傳感器
鋰電池恒溫恒濕試驗箱的濕球紗布
熟茶中常見的香氣有哪些?看這篇就夠了
對于用戶方便瀏覽的網(wǎng)站能提高網(wǎng)站收入
內(nèi)插法的RHZ-2A型絕熱用巖棉熱荷重試驗裝置GB11835
厚聲MS123WF300NT4S合金箔式電阻
有效降低了生產(chǎn)成本和維修成本
普洱茶拼配藝術(shù)
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos