在线视频亚洲一区,www.久久99,亚洲一区二区久久久久久久,精品视频一区二区三区四区五区

百度楊棟:HCE助MapReduce提升資源利用率

作者: 來源:未知 2012-03-05 16:30:01 閱讀 我要評論 直達商品

所以,在我看來我們需要找到一種手段,首先第一我能優化我的方案,第二優化用戶作業。前面說過比較難實現就是如果從配置上講,最好能配置資源,當然動態配置是因為你需要了解,思考,去模擬用戶作業到底是怎么執行的才能去做,而我們這里提出一個比較確切,比較簡單方式,我不需要了解這些配置,我從tasks靜態解決這些問題。

我們看一下Hadoop MapReduce,來看一下Task Runtime,可以看到是通過Task的JVIM,這只是一個框架,這里講的是去負責啟動用戶,用戶進城之后通過管道,標準輸入,標準輸出來做,這樣的話其實很難做到對用戶進程的控制。為什么要用JAVA呢?這是Hadoop最早提出來JAVA需要跨平臺,做系統軟件你知道用JAVA實現跨平臺很難,對于現在國內互聯網公司來說,所有服務器,以及系統都是定制的,他不需要跨平臺的功能。

第二個因為JAVA編程語言特性大家都知道,Hadoop為了更好的收縮性,他分裝了很多層,在編程者看來這是有必要進行簡化的。第三個最重要就是JNI,Hadoop是怎么做的?壓縮都是本地庫,壓縮方法有很多,比如Linux自帶的,包括LGO,包括Google最近開源壓縮庫都是C++本地,只能通過JNI,因為JNI比傳統高效一點,所以在Hadoop里面是通過JNI來做的。

第四點你本身的程序是獨立于框架的,所以你框架是很難做影響的。這一頁就給大家介紹一下現有實現的四個問題,我們怎么來解決。這是我們的目標,我們總目標基于原來框架,我們目標有兩點,第一就是提升整個集群的資源利用率,第二就是附帶解決開發效率的問題。提升資源利用率,如果我們想象把整個框架和用戶,這幅圖,如果整個框架和應用綁定起來,和用戶能綁定起來,我就能做最簡單的編譯優化,用最簡單的方式去進行實現。

第二,我們希望用C++來實現,為什么?因為我是做Hadoop出身的,所以我用Hadoop創始人那一句話有兩點,因為你的MapReduce是C++密集型計算,當然你這里不是內容密集型,因為每一個tasks執行都會推出,但如果在2.0,你的tasks為了更高效不推出去接新的tasks,對于C++來說,JAVA用的久人也知道,最近JAVA最新JNI優化器優化之后,比C++性能差不了太多,原來大家認為差5倍,4倍,現在差2,3倍,當然差距還是有。選擇C++的話,一方面比JAVA效能高,另外相對全面應用也有好處,第三點JAVA是虛擬機自己控制,而C++里面可以更快釋放。所以,對于資源管理更好,當然這些不是我的觀點。

前面回顧一下我介紹的背景,因為我們的集群在不斷的擴張,而且我們集群的使用效率會有一些問題,基于這種現狀,我們除了在作業召集的優化,我們還做了tasks級別的優化,我們是要解決兩個問題。第一要提升資源效率,框架的資源效率,第二我們希望把框架和應用程序綁定起來,這樣在優化框架同時能優化應用程序,靜態的方式。具體該怎么做,我們介紹一下。MFramework Model,首先看一下整個框架中位置,第二看一下功能模型什么樣子,第三實際處理模型什么樣子,第四看一下接口提供哪些編程接口,最后對比一下HCE和現有的Hadoop。

Overviwe,整個HCE的位置就如紅字所設,是相當于一個處理引擎。說白了實現了Hadoop里面非調度那層,因為在Hadoop里面調度是有JAVA做的,執行是有C++做的,因為調度沒必要做成C++,非內存密集型。所以,你只需要關注,這樣你可以把Hadoop分成兩層,第一層是調度,第二層是調度,執行用C++執行,調度用JAVA。

因為附帶會提供一些其他的編程語言接口,因為傳統現在一些編程語言接口用的比較多,Hadoop作為用戶一般是用JAVA,還有以數據倉庫來做,通過多變,HCE本身是C++實現的,他最終提供是C++接口。C++大家都知道,支持其他編程語言接口非常方便。因為其他腳本語言,所有都是基于C實現的,換句話你只需要做一個最簡單解釋器就能實現對接,而且更高效。

他底層是基于HDCSS,尤其在國內很多系統都是用C++實現的。如果用HadoopC++實現數據庫的話,C++框架直接去接C++的數據庫會更高效,不然的話你JAVA想把MapReduce加在C++實現的框架上,必須要實現語言轉換。所以,他對底層支持也會更好一些。整個數據通路,一般傳統數據分析流程是前端WAP抓到數據之后,給到最前端的中間件,或者KV,Data,他們通過一些云傳輸,像開源,或者通過一些大塊傳輸傳給后臺的分析系統,分析系統做一些計算,或者做一些MPI計算,這樣有上層JAVA進行讀取相關數據分析,反饋用戶最經典就是Twitter的方式,通過簡單實施流處理。

因為實施流處理不能脫離,因為有窗口概念,最終結果可能還是需要P處理來校驗,這方面不多說。我們還是回到MapReduce本身,本身我們一下具體該怎么做。MapReduce階段本身的Map階段,首先他是有讀文件,一個任務會把文件讀進來,第二是做一些Map處理,相當于是去引用用戶的一些方法,因為在一個Map處理里面,你用戶計算的這且東西越來越大內存可能放不下。因為你每臺機器可能跑8個Map,16個Map,內存放不下的時候要設置起來,有一個設置階段。還有我先寫一個臨時目錄,最后再提交到正式目錄這么一個過程。Reduce有一些Shuffling為什么重點關注Map沒有重點關注Reduce,那會我講的時候第三頁,我說過,有一個圖,本身Reduce個數就比Map要少很多,一般輕量級計算少5-10倍很正常,而且Reduce的計算是很輕量級的。

所以,你用框架去優化就夠了,不用對Reducetasks做額外優化。而且Reduce很大一部分是在Shuffling因為你是并行計算,多個Reduce需要知道輸出結果,就需要有Shuffling,多點到多點的數據傳輸,在Web2.0需要其他方式實現,我通過實現Shuffling脫離,把這部分單獨剝離出去,相當于有三個階段,總的來說還是有兩個階段,Shuffling相當于有一個獨立的服務,當Reduce輸出外之后會通知Shuffling進程,相當于服務托管,說我算完了,Shuffling服務把他把Reduce輸出結果拖到Reduce階段,傳統Reduce是要站槽位,占資源那一剎那并不能計算,把Shuffling脫離出去之后就不用占用這部分資源。

所以,HCE不解決這個問題,HCE只解決Map問題,而Shuffling的問題要留在2.0解決。看這個圖一個首先會通過Map會產生多個文件,之后會進行排序,做一些設置,最后合成整個輸出,把這個文件再Shuffling到其他Reduce處理節點上進行處理。HCE其實主要是解決Map端,因為Map端后面測試我們可以看到,Map端實際上占性能開銷最大還是OI相關的,以及比較占CPU資源的槽,我們就需要進行獨立解決。


  推薦閱讀

  圓桌沙龍:NoSQL技術實戰

時至今日,“Big data”(大數據)時代的來臨已經毋庸置疑,尤其是在電信、金融等行業,幾乎已經到了“數據就是業務本身”的地步。這種趨勢已經讓很多相信數據之力量的企業做出改變。恰逢此時,為了讓更多的人了解和使>>>詳細閱讀


本文標題:百度楊棟:HCE助MapReduce提升資源利用率

地址:http://www.sdlzkt.com/a/kandian/20120305/36929.html

樂購科技部分新聞及文章轉載自互聯網,供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯系,以便更正、刪除或按規定辦理。感謝所有提供資訊的網站,歡迎各類媒體與樂購科技進行文章共享合作。

網友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網友評論(點擊查看更多條評論)
友情提示: 登錄后發表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網友認識您。
自媒體專欄

評論

熱度

在线视频亚洲一区,www.久久99,亚洲一区二区久久久久久久,精品视频一区二区三区四区五区
99re6这里只有精品| 国产欧美亚洲精品| 国外成人免费视频| 欧美四级在线| 午夜精彩国产免费不卡不顿大片| 国产精品网红福利| 欧美日韩1区| 亚洲欧美日韩在线不卡| 国产女人精品视频| 欧美日韩综合视频| 亚洲欧美精品一区| 好看不卡的中文字幕| 国产精品美女诱惑| 久久婷婷影院| 日韩一级成人av| 亚洲国产高清在线| 欧美色图麻豆| 欧美极品一区| 亚洲欧美在线一区二区| 在线免费观看日韩欧美| 国产一区二区三区久久悠悠色av | 国产精品亚洲综合久久| 欧美日韩p片| 欧美综合国产| 亚洲精品久久久久久一区二区| 狠久久av成人天堂| 欧美日本在线观看| 欧美大胆人体视频| 亚洲欧美日本国产专区一区| 在线精品视频免费观看| 激情久久久久久| 欧美日韩在线免费视频| 欧美日韩成人网| 久久精品成人| 在线视频日韩| 亚洲一区二区高清| 亚洲国产精品一区二区第一页 | 欧美不卡视频一区| 国产无遮挡一区二区三区毛片日本| 欧美日韩高清免费| 久久精品麻豆| 久久久久久久久久久一区| 一区二区三区国产精品| 国语自产在线不卡| 伊甸园精品99久久久久久| 欧美日韩和欧美的一区二区| 欧美日本簧片| 久久久精品动漫| 久久久久久久999| 亚洲一区中文| 亚洲精品日韩在线| 亚洲精品你懂的| 国产一区欧美| 国内在线观看一区二区三区| 欧美视频亚洲视频| 国产精品腿扒开做爽爽爽挤奶网站| 欧美激情精品久久久| 欧美精品久久一区| 男人插女人欧美| 欧美精品乱人伦久久久久久| 久久久久.com| 你懂的视频一区二区| 久久精品av麻豆的观看方式| 久久在精品线影院精品国产| 亚欧成人在线| 久久蜜桃精品| 欧美一级二级三级蜜桃| 久久久久欧美精品| 欧美一区二区在线视频| 久久一二三区| 久久精品视频在线播放| 欧美成人免费在线| 玖玖精品视频| 久久精品视频在线播放| 亚洲人体影院| 精品不卡一区二区三区| 最近看过的日韩成人| 在线看国产日韩| 99精品热视频| 亚洲免费精彩视频| 亚洲欧美日韩一区二区在线| 一区二区欧美日韩视频| 欧美一区三区三区高中清蜜桃 | 亚洲国产99| 国产亚洲a∨片在线观看| 亚洲丰满少妇videoshd| 1769国内精品视频在线播放| 99国产精品视频免费观看| 亚洲人成亚洲人成在线观看| 亚洲午夜精品17c| 在线视频欧美精品| 久久精品九九| 欧美日韩国产一级片| 欧美国产乱视频| 国产精品视频| 国产精品自拍小视频| 亚洲高清二区| 亚洲国产视频一区| 亚洲综合成人在线| 免费视频一区| 欧美黄色成人网| 国产日韩精品视频一区| 国产日韩欧美中文| 亚洲精品免费一二三区| 99国产精品视频免费观看一公开| 亚洲欧美精品在线观看| 母乳一区在线观看| 欧美护士18xxxxhd| 久久精品国产久精国产思思| 一区二区三区波多野结衣在线观看| 亚洲韩国日本中文字幕| 西瓜成人精品人成网站| 欧美国产视频在线观看| 欧美精品综合| 国内不卡一区二区三区| 精品96久久久久久中文字幕无| 99xxxx成人网| 久久一二三区| 欧美精品亚洲精品| 激情五月综合色婷婷一区二区| 在线日韩av| 欧美中文字幕在线| 欧美日韩中文字幕| 国产伦精品一区二区三区照片91 | 亚洲国产精品v| 午夜精品区一区二区三| 欧美日本久久| 国产美女精品人人做人人爽| 亚洲最黄网站| 欧美成人性生活| 国产精品v欧美精品v日本精品动漫| 亚洲国产成人在线| 久久精品一区| 欧美精品一区二区在线观看| 一区在线观看| 一区二区欧美亚洲| 欧美国产先锋| 亚洲国产精品一区二区www在线| 一区二区欧美在线观看| 欧美激情一区二区久久久| 一色屋精品视频在线看| 国产深夜精品福利| 久久精品视频导航| 国产三级精品在线不卡| 亚洲国产一区二区a毛片| 久久久久成人网| 国产亚洲一级高清| 亚洲精品在线观| 欧美va天堂在线| 亚洲第一精品影视| 久久久久久亚洲精品不卡4k岛国| 欧美黑人多人双交| 亚洲精品欧美在线| 欧美激情亚洲自拍| 国产区日韩欧美| 香蕉尹人综合在线观看| 国产精品免费看久久久香蕉| 亚洲高清免费在线| 久久夜色精品| 曰韩精品一区二区| 久久婷婷蜜乳一本欲蜜臀| 欧美午夜精品久久久久久人妖| 一本色道久久88亚洲综合88| 欧美日韩国产999| 激情欧美一区二区三区在线观看| 久久久久成人精品免费播放动漫| 国产一区二区三区在线观看视频| a4yy欧美一区二区三区| 欧美日韩一区精品| 亚洲线精品一区二区三区八戒| 欧美视频二区36p| 亚洲第一成人在线| 欧美激情小视频| 一区二区黄色| 国产精品毛片a∨一区二区三区| 亚洲国产日韩欧美在线99| 欧美aⅴ一区二区三区视频| 亚洲茄子视频| 欧美日韩一区二区在线| 在线精品视频一区二区三四| 欧美成熟视频| 一区二区三区精品久久久| 国产精品男gay被猛男狂揉视频| 亚洲激情在线视频| 欧美日韩一区二区三区在线 | 亚洲日本在线视频观看| 欧美激情中文字幕乱码免费| 亚洲巨乳在线| 国产精品久久久久99| 亚洲裸体俱乐部裸体舞表演av| 欧美日韩三级视频| 亚洲男人的天堂在线观看| 国产亚洲激情| 蜜桃av噜噜一区二区三区| 国产综合久久久久久| 美玉足脚交一区二区三区图片| 亚洲人成在线观看一区二区| 久久婷婷国产综合尤物精品 | 国产欧美韩国高清| 日韩午夜激情av|