圖文詳解 hdfs 的工作機(jī)制及其原理視頻(圖文詳解 hdfs 的工作機(jī)制及其原理是什么)_1

發(fā)布時間:2024-04-20
本文主要介紹視頻詳細(xì)講解hdfs的工作機(jī)制和原理(hdfs的工作機(jī)制和原理詳細(xì)是什么),下面一起看看視頻詳細(xì)講解hdfs的工作機(jī)制和原理(hdfs的工作機(jī)制和原理詳細(xì)是什么)相關(guān)資訊。
大家好,我 m大d。
今天,我 我要和大家分享的是關(guān)于大數(shù)據(jù)引入的學(xué)習(xí)內(nèi)容,技術(shù)棧——hadoop。
為了解決大數(shù)據(jù)中海量數(shù)據(jù)的存儲和計算問題,hadoop提供了一套分布式系統(tǒng)基礎(chǔ)設(shè)施,其核心內(nèi)容包括hdfs (hadoop分布式文件系統(tǒng))、mapreduce計算引擎和yarn(另一種資源協(xié)商器)統(tǒng)一資源管理和調(diào)度。
隨著大數(shù)據(jù)技術(shù)的更新迭代,hadoop不再是單獨的技術(shù),而是大數(shù)據(jù)處理的生態(tài)系統(tǒng),如下圖所示。
除了上面提到的hadoop的三大核心組件,還有數(shù)據(jù)采集工具sqoop和flume,可以將海量數(shù)據(jù)提取到hadoop平臺進(jìn)行后續(xù)的大數(shù)據(jù)分析;zookeeper可以保證hadoop集群在部分節(jié)點宕機(jī)的情況下依然可靠運行(干貨總結(jié)!獲得動物園管理員在一篇文章中,你不 面試不用背八股(文末發(fā)pdf基于hadoop計算平臺的大數(shù)據(jù)技術(shù)框架,如數(shù)據(jù)倉庫hive、流計算風(fēng)暴、數(shù)據(jù)挖掘工具mahout、分布式數(shù)據(jù)庫hbase等。
hdfshdfs (hadoop分布式文件系統(tǒng))是google公司gfs論文思想的實現(xiàn),也作為hadoop的存儲系統(tǒng),包括客戶端、元數(shù)據(jù)節(jié)點、備份節(jié)點和數(shù)據(jù)存儲節(jié)點。
cli:元數(shù)據(jù)是管理和維護(hù)hdfs的命名空間,以fsimage和editlog的形式存儲在本地磁盤上,可以記錄客戶端在hdfs上的各種操作,如修改時間、訪問時間、塊信息等。監(jiān)控和管理datanode:負(fù)責(zé)監(jiān)控集群中datanode的健康狀態(tài)。一旦發(fā)現(xiàn)某個datanode出現(xiàn)故障,就會將其從hdfs集群中刪除,并且該datanode的數(shù)據(jù)會再次備份到其他datanode上(此過程稱為數(shù)據(jù)重新平衡,即重新平衡),以確保數(shù)據(jù)副本的完整性和集群的高可用性。secondarynamenode是namenode元數(shù)據(jù)的備份。namenode關(guān)閉后,輔助namenode將接管namenode 的工作,并負(fù)責(zé)整個集群的管理。而且為了可靠,secondarynamenode和namenode運行在不同的機(jī)器上,secondarynamenode的內(nèi)存和namenode一樣大。
同時,為了減輕namenode的壓力,namenode不會自動合并hdfs的元數(shù)據(jù)圖像文件(fsimage)和編輯日志(editlog),而是將任務(wù)留給secondarynamenode,合并后將結(jié)果發(fā)送給namenode,然后將合并后的結(jié)果存儲到本地磁盤。
存儲在hdfs上的datanode文件由數(shù)據(jù)塊組成,所有這些數(shù)據(jù)塊都存儲在datanode節(jié)點上。datanode負(fù)責(zé)具體的數(shù)據(jù)存儲,定期向namenode上報數(shù)據(jù)的元信息,并在namenode的指導(dǎo)下完成數(shù)據(jù)的i/o操作。
其實在datanode上,一個數(shù)據(jù)塊就是一個普通的文件,可以在datanode存儲塊對應(yīng)的目錄下看到(默認(rèn)在$(dfs.data.dir)/current的子目錄下)。塊名為blk_id,大小可以通過dfs.blocksize設(shè)置,默認(rèn)為128mb。
初始化時,集群中的每個datanode都會以block report的形式向namenode報告當(dāng)前存儲在該節(jié)點中的block信息。當(dāng)集群正常工作時,datanode仍然會定期向namenode報告最新的block信息,同時進(jìn)行連接。接受namenode的指令,例如在本地磁盤上創(chuàng)建、移動或刪除數(shù)據(jù)塊。
hdfs數(shù)據(jù)副本hdfs文件系統(tǒng)在設(shè)計之初就充分考慮了容錯的問題,將同一個數(shù)據(jù)塊對應(yīng)的數(shù)據(jù)副本(副本數(shù)量可以設(shè)置,默認(rèn)為3個)存儲在幾個不同的datanode上。一個datanode節(jié)點關(guān)閉后,hdfs將從備份節(jié)點讀取數(shù)據(jù)。這種容錯機(jī)制可以很好地實現(xiàn)即使節(jié)點失效,數(shù)據(jù)也不會丟失。
hdfs namenode工作機(jī)制namenode工作機(jī)制縮寫為nn。
nn啟動時,會將鏡像文件(fsimage)和編輯日志(editlog)加載到內(nèi)存中;客戶端發(fā)送添加、刪除、修改、查詢等操作請求;nn將記錄操作,滾動日志,然后在內(nèi)存中處理操作。secondarynamenode的工作機(jī)理簡稱為2nn。
當(dāng)編輯的日志數(shù)據(jù)達(dá)到一定量或每隔一定時間,就會觸發(fā)2nn向nn發(fā)送檢查點請求;如果發(fā)送的請求有響應(yīng),2nn會請求執(zhí)行檢查點請求;2nn會引導(dǎo)nn滾動更新編輯日志,并將編輯日志復(fù)制到2nn中;像編輯日志一樣將鏡像文件復(fù)制到2nn的本地檢查點目錄;2nn將圖像文件導(dǎo)入內(nèi)存,回放編輯日志并合并到新的fsimage.ckpt中;;壓縮fsimage.ckpt并寫入本地磁盤;2nn向nn發(fā)送fsimage.ckptnn會用新的fsimage.ckpt文件替換原來的fsimage,然后直接加載并啟用該文件。在hdfs文件的讀取過程中,客戶端調(diào)用filesystem對象的open方法,實際獲得一個distributedfilesystem實例;向namenode發(fā)送讀取文件的請求,然后namenode返回文件數(shù)據(jù)塊所在的datanode列表(按照客戶端到datanode網(wǎng)絡(luò)拓?fù)涞木嚯x排序),還返回一個文件系統(tǒng)fsdatainputstream對象;客戶端調(diào)用read方法時,會找出最近的datanode并連接;數(shù)據(jù)不斷從datanode流向客戶端。hdfs文件寫入過程客戶端通過調(diào)用distributedfilesystem的create方法創(chuàng)建一個新文件。文件;distributedfilesystem向namenode發(fā)送文件寫請求,此時namenode會做各種檢查,比如文件是否存在,客戶端是否有權(quán)限創(chuàng)建等等。如果驗證失敗,將引發(fā)i/o異常。如果驗證通過,namenode會將操作寫入編輯日志并返回一個可寫的datanode列表,同時還會返回文件系統(tǒng)fsdataoutputstream的對象;收到可寫列表后,客戶端會調(diào)用write方法將文件分成固定大小的數(shù)據(jù)包,并排列在數(shù)據(jù)隊列中。數(shù)據(jù)隊列中的數(shù)據(jù)包被寫入第一個datanode,然后第一個datanode將數(shù)據(jù)包發(fā)送到第二個datanode,依此類推。datanode收到數(shù)據(jù)后會返回確認(rèn)信息,收到datanode的所有確認(rèn)信息后寫操作完成。最后,更多圖解大數(shù)據(jù)技術(shù)的干貨文章,關(guān)注官方賬號:數(shù)據(jù)節(jié)拍,回復(fù):圖文系列。另外,非常歡迎大家掃描下方二維碼,加我vx: abox _ 0226,并備注 加入團(tuán)體 。關(guān)于大數(shù)據(jù)技術(shù)的問題將在小組中一起討論。
標(biāo)簽:
數(shù)據(jù)節(jié)點
了解更多視頻詳細(xì)講解hdfs的工作機(jī)制和原理(hdfs的工作機(jī)制和原理詳細(xì)是什么)相關(guān)內(nèi)容請關(guān)注本站點。
上一個:1206X106K500NT_106K 50V X5R 1206現(xiàn)貨購買,風(fēng)華X5R 1206 10uF ±10% 50V
下一個:動物疾控中心實驗室多功能污水處理裝置

風(fēng)華代理—風(fēng)華代理商都代理什么產(chǎn)品?
小辣椒像素怎么樣,國產(chǎn)小辣椒手機(jī)怎么樣
關(guān)于印發(fā)《江門市水污染防治攻堅戰(zhàn)2018年工作方案》的函
機(jī)房保溫 玻璃棉保溫 鐵皮保溫施工
交流電機(jī)綜合測試臺技術(shù)參數(shù)
消防泵*,這篇文章告訴你哪些企業(yè)的證書是安全的
南糯白毫的加工過程
AC0402FR-072K2L,國巨車規(guī)電阻0402 2.2KΩ ±1% 1/16W
溫濕度設(shè)備的操作需知
東方龍手機(jī)怎么樣,viipoo是什么牌子手機(jī)質(zhì)量怎么樣
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos