大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享,大數(shù)據(jù)技術(shù)下如何提高預(yù)處理能力-ESG跨境

大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享,大數(shù)據(jù)技術(shù)下如何提高預(yù)處理能力

來源網(wǎng)絡(luò)
來源網(wǎng)絡(luò)
2022-05-15
點贊icon 0
查看icon 835

大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享,大數(shù)據(jù)技術(shù)下如何提高預(yù)處理能力大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享問題的背景在項目中,大數(shù)據(jù)的任務(wù)執(zhí)行時間較長,需要進(jìn)行優(yōu)化,使大數(shù)據(jù)的任務(wù)執(zhí)行時間優(yōu)化到客戶可以接受的時間。分析兩個原因 業(yè)務(wù)場景分析該場景中的大數(shù)據(jù)任務(wù)主要是對數(shù)據(jù)進(jìn)行mapreduce操作,包括兩個子任務(wù)。第一個子任務(wù)的地圖......

大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享,大數(shù)據(jù)技術(shù)下如何提高預(yù)處理能力




大數(shù)據(jù)任務(wù)執(zhí)行時間優(yōu)化案例分享

問題的背景

在項目中,大數(shù)據(jù)的任務(wù)執(zhí)行時間較長,需要進(jìn)行優(yōu)化,使大數(shù)據(jù)的任務(wù)執(zhí)行時間優(yōu)化到客戶可以接受的時間。

分析兩個原因

業(yè)務(wù)場景分析

該場景中的大數(shù)據(jù)任務(wù)主要是對數(shù)據(jù)進(jìn)行mapreduce操作,包括兩個子任務(wù)。第一個子任務(wù)的地圖數(shù)量(每張地圖大小為128M)約為4300張(這些地圖任務(wù)分散在不同的服務(wù)器上,泰山集群有6400+核處理,可以充分利用泰山的多核優(yōu)勢)。地圖的執(zhí)行時間是10分鐘。但reduce的數(shù)量固定為200(即最多200個內(nèi)核并行處理reduce任務(wù)),reduce的執(zhí)行時間約為1小時30分鐘,耗時較長。同時reduce的數(shù)量少于map的數(shù)量,無法充分發(fā)揮泰山多核的優(yōu)勢,第二個子任務(wù)也是reduce階段,耗時較長。

服務(wù)器基礎(chǔ)的性能分析

執(zhí)行大數(shù)據(jù)任務(wù)時,cpu利用率不高,磁盤io和網(wǎng)卡IO不存在瓶頸。但是,網(wǎng)卡中斷需要綁定到內(nèi)核,并且可以調(diào)整磁盤緩存參數(shù)來提高性能。

三種解決方案

3.1網(wǎng)卡調(diào)整

3.1.1中斷核結(jié)合

中斷關(guān)聯(lián)性被描述為一組能夠?qū)μ囟ㄖ袛嘧龀鲰憫?yīng)的CPU。如果應(yīng)用程序可以通過關(guān)聯(lián)相關(guān)的CPU在相同的CPU上下文中處理收到的數(shù)據(jù)包,則可以減少等待時間并提高CPU利用率。

因此,我們可以將處理網(wǎng)卡中斷的CPU內(nèi)核設(shè)置在網(wǎng)卡所在的NUMA上,從而減少跨NUMA內(nèi)存訪問帶來的額外開銷,提高網(wǎng)絡(luò)處理性能。

3.2磁盤參數(shù)調(diào)整

3.2.1磁盤讀取預(yù)取參數(shù)

/sys/block/sdx/queue/read ahead。該參數(shù)對于順序讀取非常有用。意思是,一次提前看多少內(nèi)容,不管實際需要多少。默認(rèn)情況下,一次讀取128kb遠(yuǎn)小于您想要讀取的內(nèi)容。設(shè)置大一點對于讀取大文件非常有用,可以有效減少讀尋道的次數(shù)。該參數(shù)可通過使用塊dev–setra進(jìn)行設(shè)置。setra設(shè)置了多少個扇區(qū),因此實際字節(jié)除以2。例如,設(shè)置512實際讀取256個字節(jié)。

原始服務(wù)器值是128kb,它被設(shè)置為4096Kb。

3.2.2緩存寫入磁盤的參數(shù)調(diào)整

/proc/sys/vm/dirtyratio從20更改為40

此參數(shù)控制文件系統(tǒng)的文件系統(tǒng)寫緩沖區(qū)的大小。單位是百分比,表示系統(tǒng)內(nèi)存的百分比。它表示當(dāng)寫緩沖區(qū)用完系統(tǒng)內(nèi)存時,它開始向磁盤寫入數(shù)據(jù)。如果增加,更多的系統(tǒng)內(nèi)存將用于磁盤寫緩沖,系統(tǒng)的寫性能也將大大提高。

/proc/sys/VM/dirty background ratio從10更改為20

此參數(shù)控制文件系統(tǒng)的pdflush進(jìn)程以及何時刷新磁盤。是單位百分比,表示系統(tǒng)內(nèi)存的百分比。這意味著當(dāng)寫緩沖區(qū)用完系統(tǒng)內(nèi)存時,pdflush開始向磁盤寫入數(shù)據(jù)。

如果增加,更多的系統(tǒng)內(nèi)存將用于磁盤寫緩沖,系統(tǒng)的寫性能也將大大提高。

/proc/sys/VM/dirty write back centi secs從500更改為800

此參數(shù)控制內(nèi)核的臟數(shù)據(jù)刷新進(jìn)程pdflush的運(yùn)行間隔。單位是1/100秒。默認(rèn)值為500,即5秒。

/proc/sys/VM/dirty expire centi secs從3000更改為30000。

該參數(shù)聲明Linux內(nèi)核寫緩沖區(qū)中的數(shù)據(jù)為“舊”后,pdflush進(jìn)程開始考慮將其寫入磁盤。單位是1/100秒。默認(rèn)是30000,也就是說即使30秒的數(shù)據(jù)是舊的,也會刷新磁盤。

對于特別重載的寫操作,適當(dāng)降低這個值也是好的,但是不能降低太多,因為降低太多會導(dǎo)致IO增加過快。

3.3應(yīng)用程序調(diào)整

3.3.1優(yōu)化數(shù)量的減少

調(diào)整大數(shù)據(jù)平臺上的reduce設(shè)置,使最大reduce數(shù)由200改為500,性能明顯提升。

3.3.2 Reduce并行復(fù)制參數(shù)maprd.reduce.parallel.copies優(yōu)化

reduce的并發(fā)副本數(shù)默認(rèn)為5,后來調(diào)整為30可以增加Reduce的最大并發(fā)副本數(shù)。

調(diào)優(yōu)后,最終大數(shù)據(jù)任務(wù)執(zhí)行時間有了顯著提升。

四總結(jié)

調(diào)優(yōu)后,任務(wù)在泰山集群服務(wù)器上的執(zhí)行時間明顯改善。相關(guān)想法總結(jié)如下:

分析確認(rèn)大數(shù)據(jù)任務(wù)執(zhí)行各階段耗時,重點關(guān)注耗時階段,提高降低并發(fā),充分利用泰山多核優(yōu)勢。

找出性能瓶頸,優(yōu)化服務(wù)器各子模塊的參數(shù)。


文章推薦
Snapchat 實現(xiàn)精準(zhǔn)定位的幾大手段,snapchat定位分析
出海機(jī)電行業(yè)之如何玩轉(zhuǎn)Yandex動態(tài)廣告分享
出??缇畴娚藤u家如何選擇海外社交媒體營銷平臺,跨境電商哪個平臺比較好呢
超詳細(xì)2022不可錯過的《購物應(yīng)用移動歸因與營銷分析指南》,2022春節(jié)購物清單


特別聲明:以上文章內(nèi)容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。

搜索 放大鏡
韓國平臺交流群
加入
韓國平臺交流群
掃碼進(jìn)群
歐洲多平臺交流群
加入
歐洲多平臺交流群
掃碼進(jìn)群
美國賣家交流群
加入
美國賣家交流群
掃碼進(jìn)群
ESG跨境專屬福利分享群
加入
ESG跨境專屬福利分享群
掃碼進(jìn)群
拉美電商交流群
加入
拉美電商交流群
掃碼進(jìn)群
亞馬遜跨境增長交流群
加入
亞馬遜跨境增長交流群
掃碼進(jìn)群
亞馬遜跨境增長交流群
加入
亞馬遜跨境增長交流群
掃碼進(jìn)群
拉美電商交流群
加入
拉美電商交流群
掃碼進(jìn)群
ESG獨家招商-PHH GROUP賣家交流群
加入
ESG獨家招商-PHH GROUP賣家交流群
掃碼進(jìn)群
《法國Fnac平臺知識百科》
2025跨境電商營銷日歷
《2024年全球消費(fèi)趨勢白皮書——美國篇》
《2024TikTok出海達(dá)人營銷白皮書》
《Coupang自注冊指南》
《eMAG知識百科》
《TikTok官方運(yùn)營干貨合集》
《韓國節(jié)日營銷指南》
《開店大全-全球合集》
《TikTok綜合運(yùn)營手冊》
通過ESG入駐平臺,您將解鎖
綠色通道,更高的入駐成功率
專業(yè)1v1客戶經(jīng)理服務(wù)
運(yùn)營實操指導(dǎo)
運(yùn)營提效資源福利
平臺官方專屬優(yōu)惠

立即登記,定期獲得更多資訊

訂閱
聯(lián)系顧問

平臺顧問

平臺顧問 平臺顧問

微信掃一掃
馬上聯(lián)系在線顧問

icon icon

小程序

微信小程序

ESG跨境小程序
手機(jī)入駐更便捷

icon icon

返回頂部

【免費(fèi)領(lǐng)取】全球跨境電商運(yùn)營干貨 關(guān)閉
進(jìn)行中
進(jìn)行中
2025跨境電商營銷日歷
包括傳統(tǒng)中、外重要節(jié)日及重點電商營銷節(jié)點還對營銷關(guān)鍵市場、選品輔以說明,讓你的365天安排的明明白白!
免費(fèi)領(lǐng)取
進(jìn)行中
進(jìn)行中
【平臺干貨】eMAG知識百科
涵蓋從開店到大賣6個板塊:開店、運(yùn)營、廣告、選品、上架、物流
免費(fèi)領(lǐng)取
進(jìn)行中
進(jìn)行中
TikTok運(yùn)營必備干貨包
包含8個TikTok最新運(yùn)營指南(市場趨勢、運(yùn)營手冊、節(jié)日攻略等),官方出品,專業(yè)全面!
免費(fèi)領(lǐng)取
進(jìn)行中
進(jìn)行中
韓國coupang平臺自注冊指南
韓國Coupang電商平臺從注冊準(zhǔn)備、提交申請到完成注冊,開店全流程詳細(xì)指引。
免費(fèi)領(lǐng)取
進(jìn)行中
進(jìn)行中
全球平臺詳解——全球合集
涵括全球100+個電商平臺的核心信息,包括平臺精煉簡介、競爭優(yōu)勢、熱銷品類、入駐要求以及入駐須知等關(guān)鍵內(nèi)容。
立即領(lǐng)取
進(jìn)行中
進(jìn)行中
韓國電商節(jié)日營銷指南
10+韓國電商重要營銷節(jié)點詳細(xì)解讀;2024各節(jié)日熱度選品助力引爆訂單增長;8大節(jié)日營銷技巧輕松撬動大促流量密碼。
免費(fèi)領(lǐng)取
進(jìn)行中
進(jìn)行中
全球平臺詳解——歐洲篇
涵蓋20+歐洲電商平臺,詳細(xì)解讀優(yōu)勢、入駐條件、熱銷品等
立即領(lǐng)取
国第一产在线无码精品区,aaa无码视频在线观看,久久强奷乱码老熟女,国产一级aⅴ无码毛片