欧美99999网站,国产亚洲经典视频,无码精区久久久一区

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

創(chuàng)新互聯(lián)Hadoop教程：HadoopFailover

失敗類型

程序問題
進程崩潰
硬件問題

失敗處理

任務(wù)失敗

運行時異?；蛘逬VM退出都會報告給ApplicationMaster
通過心跳來檢查掛住的任務(wù)(timeout)，會檢查多次（可配置）才判斷該任務(wù)是否失效
一個作業(yè)的任務(wù)失敗率超過配置，則認為該作業(yè)失敗
失敗的任務(wù)或作業(yè)都會有ApplicationMaster重新運行

ApplicationMaster失敗

ApplicationMaster定時發(fā)送心跳信號到ResourceManager，通常一旦ApplicationMaster失敗，則認為失敗，但也可以通過配置多次后才失敗
一旦ApplicationMaster失敗，ResourceManager會啟動一個新的ApplicationMaster
新的ApplicationMaster負責(zé)恢復(fù)之前錯誤的ApplicationMaster的狀態(tài)(yarn.app.mapreduce.am.job.recovery.enable=true)，這一步是通過將應(yīng)用運行狀態(tài)保存到共享的存儲上來實現(xiàn)的，ResourceManager不會負責(zé)任務(wù)狀態(tài)的保存和恢復(fù)
Client也會定時向ApplicationMaster查詢進度和狀態(tài)，一旦發(fā)現(xiàn)其失敗，則向ResouceManager詢問新的ApplicationMaster

NodeManager失敗

NodeManager定時發(fā)送心跳到ResourceManager，如果超過一段時間沒有收到心跳消息，ResourceManager就會將其移除
任何運行在該NodeManager上的任務(wù)和ApplicationMaster都會在其他NodeManager上進行恢復(fù)
如果某個NodeManager失敗的次數(shù)太多，ApplicationMaster會將其加入黑名單（ResourceManager沒有），任務(wù)調(diào)度時不在其上運行任務(wù)

ResourceManager失敗

通過checkpoint機制，定時將其狀態(tài)保存到磁盤，然后失敗的時候，重新運行
通過zookeeper同步狀態(tài)和實現(xiàn)透明的HA

可以看出，一般的錯誤處理都是由當(dāng)前模塊的父模塊進行監(jiān)控（心跳）和恢復(fù)。而最頂端的模塊則通過定時保存、同步狀態(tài)和zookeeper來?實現(xiàn)HA

創(chuàng)新互聯(lián)公司長期為1000+客戶提供的網(wǎng)站建設(shè)服務(wù)，團隊從業(yè)經(jīng)驗10年，關(guān)注不同地域、不同群體，并針對不同對象提供差異化的產(chǎn)品和服務(wù)；打造開放共贏平臺，與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為昌都企業(yè)提供專業(yè)的成都網(wǎng)站制作、網(wǎng)站建設(shè)，昌都網(wǎng)站改版等技術(shù)服務(wù)。擁有十年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

分享標(biāo)題：創(chuàng)新互聯(lián)Hadoop教程：HadoopFailover
本文URL：http://www.dlmjj.cn/article/cdoheip.html

日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区