日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
Hadoop怎么優(yōu)化

小編給大家分享一下Hadoop怎么優(yōu)化,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

我們提供的服務(wù)有:成都網(wǎng)站建設(shè)、成都網(wǎng)站制作、微信公眾號(hào)開(kāi)發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、萬(wàn)年ssl等。為數(shù)千家企事業(yè)單位解決了網(wǎng)站和推廣的問(wèn)題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的萬(wàn)年網(wǎng)站制作公司

在用hadoop測(cè)試些程序,但是,用的數(shù)據(jù)都是小數(shù)據(jù),用hadoop處理起來(lái)相當(dāng)慢,每個(gè)文件就只有幾KB,而文件有幾百個(gè),這樣,20MB的數(shù)據(jù)運(yùn)行完就要40多分鐘,而且即使是4臺(tái)機(jī)器,運(yùn)行完也要14分鐘,這完全是浪費(fèi)了hadoop,最后發(fā)現(xiàn),每臺(tái)電腦只有兩個(gè)Map,這就讓Map過(guò)很相當(dāng)漫長(zhǎng)。查了一些資料,發(fā)現(xiàn)暫時(shí)有兩項(xiàng)現(xiàn)在我用得著

1、設(shè)置Map數(shù):

    在conf文件夾中的mapred-site.xml文件里加入

    mapred.tasktracker.map.tasks.maximum

    格式如下:


    mapred.tasktracker.map.tasks.maximum
    10

    這里只設(shè)置了10個(gè),看網(wǎng)上說(shuō)的一般一個(gè)節(jié)點(diǎn)的map數(shù)是30到300個(gè),大家可以根據(jù)具體情況自行設(shè)置

2、設(shè)置JVM重用

    默認(rèn)是1,表示一個(gè)JVM上最多可以順序執(zhí)行的task數(shù)目(屬于同一個(gè)Job)是1。也就是說(shuō)一個(gè)task啟一個(gè)JVM。

    顯然,這樣每次用一次就重啟JVM很浪費(fèi)時(shí)間,所以可以把這個(gè)的重用次數(shù)設(shè)置大一點(diǎn),我這里設(shè)置成-1,表示無(wú)限適用,直到最后把程序跑完。

    和設(shè)置Map數(shù)差不多,同樣是在mapred-site.xml中設(shè)置,如下:


    mapred.job.reuse.jvm.num.tasks
    -1

    不用再次格式化,可以直接運(yùn)行?,F(xiàn)在,即使是偽分布,運(yùn)行剛才的程序只需要11分30秒。

    筆者將繼續(xù)學(xué)習(xí),找到更合理的辦法。同時(shí),可以把數(shù)據(jù)進(jìn)行壓縮過(guò)后在運(yùn)行程序,但是筆者暫時(shí)還沒(méi)搞懂這個(gè)方法怎么用。

參考網(wǎng)址:

http://blog.csdn.net/wangqiaoshi/article/details/18142885

http://jerrylead.iteye.com/blog/1195335

3、Java heap space的解決辦法:

    這個(gè)表明java的虛擬的空間不夠了。下面有兩種方法可以解決:

    ①修改hadoop/bin文件夾中的hadoop文件:

    找到“export HADOOP_OPTS=”這一行,修改如下:

 export HADOOP_OPTS="-Xmx4096m"http://將jvm的空間設(shè)置為4GB,也可以設(shè)置成你想要的

    ②(建議使用此方法)也可以修改mapred-site.xml文件:

    加入如下內(nèi)容:


    mapred.child.java.opts
    -Xmx4096m

    保存退出重啟hadoop即可。

4、修改HDFS的塊的大?。?/p>

    默認(rèn)是64MB,但是一般用128MB,而且有些特殊情況要把塊改小一點(diǎn)??傊芏嗲闆r,需要更改塊的大小,方法如下:

    修改conf文件夾中hdfs-site.xml的內(nèi)容,加入如下內(nèi)容:


    dfs.block.size
    自己想要的大小,單位是B

    保存退出,格式化HDFS

以上是“Hadoop怎么優(yōu)化”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!


新聞標(biāo)題:Hadoop怎么優(yōu)化
網(wǎng)站地址:http://www.dlmjj.cn/article/ijohpi.html