久久中文久久字幕_国产精品99久久久久久www_国产亚洲精品自在久久_国产精品一区视频

歡迎進入儀商網!

RDMA網絡下MMU水線應如何設置

RDMA(遠程直接數據存取),以其對業務帶來的高性能、低延時優勢,在數據中心尤其是AI、HPC、大數據等場景得到了廣泛應用。為保障RDMA的穩定運行,基礎網絡需要提供端到端無損零丟包及超低延時的能力,這也催生了PFC、ECN等網絡流控技術在RDMA網絡中的部署。在RDMA網絡中,如何合理設置MMU(緩存管理單元)水線是保證RDMA網絡無損和低延時的關鍵。本文將以RDMA網絡作為切入點,結合實際部署經驗,分析MMU水線設置的一些思路。

什么是RDMA

RDMARemote Direct Memory Access),通俗的說就是遠程的DMA技術,是為了解決網絡傳輸中服務器端數據處理的延遲而產生的。


傳統模式與RDMA模式工作機制對比

如上圖,在傳統模式下,兩臺服務器上的應用之間傳輸數據,過程是這樣的:

  • 首先要把數據從應用緩存拷貝到Kernel中的TCP協議棧緩存;
  • 然后再拷貝到驅動層;
  • 最后拷貝到網卡緩存。

多次內存拷貝需要CPU多次介入,導致處理延時大,達到數十微秒。同時整個過程中CPU過多參與,大量消耗CPU性能,影響正常的數據計算。

RDMA 模式下,應用數據可以繞過Kernel協議棧直接向網卡寫數據,帶來的顯著好處有:

  • 處理延時由數十微秒降低到1微秒內;
  • 整個過程幾乎不需要CPU參與,節省性能;
  • 傳輸帶寬更高。

RDMA對于網絡的訴求

RDMA在高性能計算、大數據分析、IO高并發等場景中應用越來越廣泛。諸如iSICI, SAN, Ceph, MPI, Hadoop, Spark, Tensorflow等應用軟件都開始部署RDMA技術。而對于支撐端到端傳輸的基礎網絡而言,低延時(微秒級)、無損(lossless)則是最重要的指標。

低延時

網絡轉發延時主要產生在設備節點(這里忽略了光電傳輸延時和數據串行延時),設備轉發延時包括以下三部分:

存儲轉發延時:芯片轉發流水線處理延遲,每個hop會產生1微秒左右的芯片處理延時(業界也有嘗試使用cut-through模式,單跳延遲可以降低到0.3微秒左右);

Buffer緩存延時:當網絡擁塞時,報文會被緩存起來等待轉發。這時Buffer越大,緩存報文的時間就越長,產生的時延也會更高。對于RDMA網絡,Buffer并不是越大越好,需要合理選擇;

重傳延時:在RDMA網絡里會有其他技術保證不丟包,這部分不做分析。

無損

RDMA在無損狀態下可以滿速率傳輸,而一旦發生丟包重傳,性能會急劇下降。在傳統網絡模式下,要想實現不丟包最主要的手段就是依賴大緩存,但如前文所說,這又與低延時矛盾了。因此,在RDMA網絡環境中,需要實現的是較小Buffer下的不丟包。

在這個限制條件下,RDMA實現無損主要是依賴基于PFCECN的網絡流控技術。

PFC

PFCPriority-based Flow Control),基于優先級的流量控制。是一種基于隊列的反壓機制,通過發送Pause幀通知上游設備暫停發包來防止緩存溢出丟包。


PFC工作機制示意圖

PFC允許單獨暫停和重啟其中任意一條虛擬通道,同時不影響其它虛擬通道的流量。如上圖所示,當隊列7Buffer消耗達到設置的PFC流控水線,會觸發PFC的反壓:

本端交換機觸發發出PFC Pause幀,并反向發送給上游設備;

收到Pause幀的上游設備會暫停該隊列報文的發送,同時將報文緩存在Buffer中;

如果上游設備的Buffer也達到閾值,會繼續觸發Pause幀向上游反壓;

最終通過降低該優先級隊列的發送速率來避免數據丟包;

Buffer占用降低到恢復水線時,會發送PFC解除報文。

RDMA無損網絡的關鍵技術:ECN

ECNExplicit Congestion Notification):顯示擁塞通知。ECN是一個非常古老的技術,只是之前使用的并不普遍,該協議機制作用于主機與主機之間。

ECN是報文在網絡設備出口(Egress port)發生擁塞并觸發ECN水線時,使用IP報文頭的ECN字段標記數據包,表明該報文遇到網絡擁塞。一旦接收服務器發現報文的ECN被標記,立刻產生CNP(擁塞通知報文),并將它發送給源端服務器,CNP消息里包含了導致擁塞的Flow信息。源端服務器收到后,通過降低相應流發送速率,緩解網絡設備擁塞,從而避免發生丟包。

通過之前的描述可以了解到,PFCECN之所以可以實現網絡端到端的零丟包,是通過設置不同的水線來實現的。對這些水線的合理設置,就是針對交換機MMU的精細化管理,通俗講就是對交換機Buffer的管理。接下來我們具體分析下PFC的水線設置。

PFC水線設置

交換芯片都有固定的Pipeline(轉發流水線), Buffer管理處于入芯片流程和出芯片流程的中間位置。報文處于在這個位置上時,已經知道了該報文的入口和出口信息,因此邏輯上就可以分成入方向和出方向分別對緩存進行管理。

PFC水線是基于入方向緩存管理進行觸發的。芯片在入口方向提供了8個隊列,我們可以將不同優先級的業務報文映射到不同的隊列上,從而實現對不同優先級的報文提供不同的Buffer分配方案。


隊列Buffer的組成部分

具體到每個隊列,其Buffer分配根據使用場景設計為3部分:保證緩存,共享緩存,Headroom

保證緩存:每個隊列的專用緩存,確保每個隊列均有一定緩存以保證基本轉發;

共享緩存:流量突發時可以申請使用的緩存,所有隊列共享;

Headroom:在觸發PFC水線后,到服務器響應降速前,還可以繼續使用的緩存。

保證緩存設置

保證緩存是一個靜態水線(固定的、獨享的)。靜態水線的利用率非常低,資源消耗卻非常大。我們在實際部署時建議不分配保證緩存,以減少這部分的緩存消耗。這樣,入方向報文直接使用共享緩存空間,可提高Buffer的利用率。

共享緩存設置

對于共享緩存的設置,需要采用更為靈活的動態水線。動態水線能根據當前空閑的Buffer資源,以及當前隊列已使用的Buffer資源數量來決定能否繼續申請到資源。由于系統中空閑共享Buffer資源與已使用的Buffer資源都是時刻變化的,因此閾值也處于不斷變動中。相對于靜態水線,動態水線能更靈活、有效的利用Buffer及避免造成不必要的浪費。

銳捷網絡交換機支持基于動態的方式進行Buffer資源的分配,對共享緩存的設置分為11檔,動態水線alpha=隊列可申請緩存量/剩余共享緩存量。隊列的α值越大,其在共享緩存中可使用的百分數占比也就越高。


共享水線α值與可使用率對應關系

我們不妨分析一下:

隊列的α值設置越小,其最大可申請的共享緩存占比就越小。當端口擁塞時就會越早觸發PFC流控,PFC流控生效后隊列降速,可以很好地保證網絡不丟包。

但從性能的角度看,過早觸發PFC流控,會導致RDMA網絡吞吐下降。因此我們在MMU水線設置時需要選取一個平衡值。

PFC水線到底設置多少,是一個非常復雜的問題,理論上不存在一個固定的值。實際部署時,需要我們具體分析業務模型,并搭建測試環境進行水線調優,找到匹配業務的最佳水線。

Headroom設置

Headroom:顧名思義,就是頭部空間的意思,是在PFC觸發后,到PFC真正生效這一段時間,用來緩存隊列報文的。Headroom設置多大合適?這里與4個因素有關:

PG檢測到觸發XOFF水線,到構造PFC幀發出的時間(這里主要跟配置的檢測精度以及平均隊列算法相關,固定配置是固定值)

上游收到PFC Pause幀,到停止隊列轉發的時間(主要跟芯片處理性能有關系,交換芯片實際上是固定值)

PFC Pause幀在鏈路上的傳輸時間(跟AOC線纜/光纖距離成正比)

隊列暫停發送后鏈路中報文的傳輸時間(跟AOC線纜/光纖距離成正比)

因此Headroom所需要的緩存大小,我們可以根據組網的架構,以及流量模型測算得出。以100米光纖線 + 100G光模塊,緩存64字節小包,計算出所需的Headroom大小是408cellcell是緩存管理的最小單元,一個報文會占用1個或者多個cell),實際測試數據也吻合。當然,考慮一定的冗余性,Headroom設置建議比理論值稍大。

RDMA網絡實踐

銳捷網絡在研發中心搭建了模擬真實業務的RDMA網絡,架構如下:


銳捷網絡RDMA組網架構

組網模型:大核心三級組網架構,核心采用高密100G線卡;

POD內:Spine采用提供64100G接口的 BOX設備,Leaf采用提供4825G接口+8100G接口的BOX設備;

Leaf作為服務器網關,支持和服務器間基于PFC流控(識別報文的DSCP并進行PG映射),同時支持擁塞ECN標記;

RDMA僅運行于POD內部,不存在跨PODRDMA流量,因此核心無需感知RDMA流量;

為了避免擁塞丟包,需要在LeafSpine之間部署PFC流控技術,同時Spine設備也需要支持基于擁塞的ECN標記;

LeafSpine設備支持PFC流控幀統計、ECN標記統計、擁塞丟包統計、基于隊列的擁塞統計等,并支持將統計信息通過gRPC同步到遠端gRPC服務器。

銳捷網絡在研發中心同樣搭建了模擬真實業務的浸泡組網環境(包括RG-S6510RG-S6520RG-N18000-X系列25G/100G網絡設備、大型測試儀、25G服務器)。在疊加了多種業務模型,并進行了長時間浸泡測試后,我們對于RDMA網絡的MMU水線設置已有一些推薦的經驗值。此外,在RDMA網絡中,還存在一些部署難點,比如多級網絡中 PFC風暴、死鎖問題、ECN水線設計復雜問題等。對于這些問題,銳捷網絡也有一些研究和積累,期待與大家共同探討。



聲明: 聲明:凡本網注明"來源:儀商網"的所有作品,版權均屬于儀商網,未經本網授權不得轉載、摘編使用。
經本網授權使用,并注明"來源:儀商網"。違反上述聲明者,本網將追究其相關法律責任。
本網轉載并注明自其它來源的作品,歸原版權所有人所有。目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。如有作品的內容、版權以及其它問題的,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
本網轉載自其它媒體或授權刊載,如有作品內容、版權以及其它問題的,請聯系我們。相關合作、投稿、轉載授權等事宜,請聯系本網。
QQ:2268148259、3050252122。

久久中文久久字幕_国产精品99久久久久久www_国产亚洲精品自在久久_国产精品一区视频
男人舔女人下面高潮视频| 国产经品一区二区| 豆国产97在线| 久久精品视频在线| 日本一区二区三区免费看| 福利视频久久| 久久中文字幕在线视频| 欧美日韩性生活片| 国产成人精品久久亚洲高清不卡| 亚洲字幕在线观看| 激情五月五月婷婷| 日韩亚洲精品视频| 日本不卡久久| 久久99精品久久久水蜜桃| 亚洲欧美日韩在线综合| 国产日韩在线观看av| 国产精品黄色影片导航在线观看| 欧美一区在线直播| www国产精品视频| 热久久免费国产视频| 久久精品国产精品青草色艺| 无码人妻精品一区二区三区99v| 99国精产品一二二线| 亚洲一区二区三区777| 成人免费网视频| 国产99久久久欧美黑人| 国产一区二区色| 国产精品成人一区二区三区吃奶| 青青草国产精品视频| 国产成人生活片| 欧美精品成人网| 国产精品-区区久久久狼| 免费在线黄网站| 国产精品成人久久电影| 国产日韩第一页| 欧美情侣性视频| 不卡一卡2卡3卡4卡精品在| 亚洲一区二区三区精品动漫 | 丰满爆乳一区二区三区| 国产精品国产三级国产aⅴ9色| 国内精品视频久久| 精品国产一区二区三区免费| 国产美女主播在线播放| 伊甸园精品99久久久久久| 91麻豆精品秘密入口| 污视频在线免费观看一区二区三区| 久久视频这里有精品| 欧美日韩午夜爽爽| 国产精品劲爆视频| 国产精品亚洲美女av网站| 日韩中文字幕三区| 国产精品视频免费观看www| 国产欧美在线播放| 亚洲精品影院| 久久99精品国产99久久| 国产亚洲二区| 亚洲欧美成人一区| 久久久精品免费| 国产精品一区二区3区| 日本中文字幕一级片| 国产精品美女av| 91免费福利视频| 欧美亚洲在线播放| 久久久久久国产精品| 久久国产欧美精品| 国产一区自拍视频| 大地资源第二页在线观看高清版| 久久最新资源网| 高清不卡一区二区三区| 日本久久久精品视频| 国产精品免费网站| 91av在线网站| 精品一区二区国产| 欧美一级片免费在线| 精品国产乱码久久久久久蜜柚 | 日日碰狠狠躁久久躁婷婷| 久久深夜福利免费观看| av在线com| 欧洲精品在线一区| 一区二区三区国产福利| 久久久久久久网站| 成人亚洲欧美一区二区三区| 欧美最猛性xxxxx(亚洲精品)| 久热精品视频在线观看| 久久国产午夜精品理论片最新版本| 国产日韩欧美视频| 日韩中文字幕一区二区| 精品国产一区二区三区麻豆小说| 久久精品香蕉视频| 国产免费色视频| 欧美视频在线观看视频| 色乱码一区二区三在线看| 精品国产一区二区三区麻豆免费观看完整版 | 一区二区在线高清视频| 精品国产美女在线| 91麻豆桃色免费看| 国产在线一区二区三区欧美| 日韩久久久久久久| 午夜精品视频在线观看一区二区| 国产精品少妇在线视频| 国产xxx69麻豆国语对白| 成人黄色一区二区| 国产又粗又爽又黄的视频| 欧美在线播放cccc| 色欲色香天天天综合网www| 在线精品日韩| 精品国产一二| 国产精品久久久久久超碰| 久激情内射婷内射蜜桃| 777午夜精品福利在线观看| 国产免费裸体视频| 国产主播在线一区| 黄网站欧美内射| 青草成人免费视频| 午夜精品久久久久久久久久久久| 一区二区三区四区欧美| 久久99热精品| 久热精品视频在线观看| 国产精品美女999| 久久久精品在线观看| www.99久久热国产日韩欧美.com| 国产xxx69麻豆国语对白| 久久久中精品2020中文| 68精品国产免费久久久久久婷婷| 91老司机精品视频| 波多野结衣成人在线| 国产另类自拍| 成人精品视频一区二区| www.av蜜桃| 成人短视频在线观看免费| 国产青春久久久国产毛片| 国产日韩欧美影视| 国产精品一区二区欧美| 99在线观看视频网站| 91精品久久久久久蜜桃| 久久婷婷开心| 国产mv免费观看入口亚洲| 国产成人黄色片| 日韩一中文字幕| 久久久精品久久久| 国产精品久久久久久久天堂| 久久亚洲欧美日韩精品专区| 美女精品视频一区| 亚洲一区二区三区777| 亚洲在线免费观看| 五月天综合网| 秋霞在线观看一区二区三区| 欧美日韩一区二区三| 黑人中文字幕一区二区三区| 国产日韩欧美中文在线播放| 国产精品专区第二| 国产精品9999久久久久仙踪林| 九九九九九九精品| 久久人人爽人人爽人人片亚洲| 国产精品久久久久久久久婷婷| 免费av在线一区| 亚洲精品免费在线看| 日本一级黄视频| 黄色一级免费大片| 国产一区免费在线| 成人久久一区二区| 久久精品国产99精品国产亚洲性色 | 日本手机在线视频| 欧美xxxx黑人又粗又长密月| 国产亚洲精品美女久久久m| 成人国产精品久久久| 国产suv精品一区二区| 久久精品夜夜夜夜夜久久| 国产精品成人品| 亚洲va久久久噜噜噜| 日韩精品无码一区二区三区| 蜜桃av久久久亚洲精品| av在线亚洲男人的天堂| 久久久久久香蕉网| 欧美日韩成人在线观看| 午夜视频在线瓜伦| 国语精品中文字幕| 777久久精品一区二区三区无码 | 日韩中文娱乐网| 欧美激情一区二区久久久| 欧美一级片久久久久久久| 欧美日韩精品免费在线观看视频| 国产日韩专区在线| 久久免费视频在线| 久久夜色撩人精品| 色婷婷综合久久久久中文字幕| 精品人妻少妇一区二区| 久久久午夜视频| 国产精品成人国产乱一区| 欧美一区二区大胆人体摄影专业网站| 国产在线一区二区三区播放| 国产成人综合一区| 久久久久国产精品一区| 欧洲精品久久久| 国产精品18毛片一区二区| 欧美麻豆久久久久久中文| 日韩av免费在线播放| 国产欧美日韩专区发布| www.日韩欧美| 欧美一级淫片播放口|