博通評論英偉達競品:沒有獨到之處

2023-06-10 14:01:31


來源:內容由半導體行業觀察編譯自The Register,謝謝。


在早前舉辦的Computex,Nvidia 通過推出其 Spectrum-X 平臺承諾爲生成 AI 工作負載提供“無損以太網”——但如果你問 Broadcom,這甚至不是一個新想法。


Broadcom 核心交換組高級副總裁 Ram Velaga 告訴The Register說:“他們的設備沒有什么我們沒有的獨特之處。”

他解釋說,Nvidia 實際上用 Spectrum-X 所做的是構建一個垂直集成的以太網平臺,該平臺擅長以最小化尾延遲和減少 AI 作業完成時間的方式管理擁塞。

Velaga 認爲,這與 Broadcom 對其Tomahawk5和Jericho3-AI交換機 ASIC所做的沒有什么不同。他還認爲 Nvidia 承認以太網對於處理 AI 中的 GPU 流更有意義。

Nvidia 的 Spectrum-X

就 Nvidia 而言,它並沒有放棄 InfiniBand 網絡。InfiniBand 非常適合那些運行少量非常大的工作負載的用戶——例如 GPT3 或數字孿生。然而,Nvidia 網絡部門營銷副總裁 Gilad Shainer 告訴The Register,在某些環境中,尤其是多租戶雲,以太網是首選。

Shainer 說,對於較小的 AI/ML 工作負載,傳統的以太網基礎設施工作得很好——但現在這些工作負載的增長超出了一個節點,速度太慢了。

Nvidia 的 Spectrum-X 平臺聲稱可以應對這一挑战。

需要明確的是,Nvidia 的 Spectrum-X 不是產品。它是硬件和軟件的集合,我們過去已經介紹了其中的大部分內容。核心組件包括 Nvidia 的 51.2Tbit/sec Spectrum-4 以太網交換機和BlueField-3數據處理單元 (DPU)。

基本思想是,只要您同時使用 Nvidia 的交換機和它的 DPU,它們就會協同工作以緩解流量擁塞,並且——如果 Nvidia 可信的話——完全消除數據包丟失。

雖然 Shainer 聲稱這是 Nvidia 的一個全新功能單元,但 Velaga 認爲“無損以太網”的想法只是營銷。“與其說它是無損的,不如說你有效地管理了擁塞,以至於你擁有了一個非常高效的以太網結構,”他爭辯道。

換句話說,不是包丟失是給定的以太網網絡,而是規則的例外。無論如何,這就是想法。

此外,Velaga 聲稱這種擁塞管理已經內置到 Broadcom 最新一代的交換機 ASIC 中——只有它們可以與任何供應商或雲服務提供商的 smartNIC 或 DPU 一起使用。“你不必在 NIC 上做,你可以從一個 Jericho3-AI 到另一個 Jericho3-AI ,”他補充道。

當我們向 Shainer 詢問 Broadcom 的 Tomahawk5 和 Jericho3-AI 時,他拒絕與這些芯片進行比較,他辯稱 Spectrum-X 屬於自己的一類,並暗示一些供應商只是將“AI”附加到現有產品上。

“無論你怎么稱呼它,都沒有任何東西具有專爲 AI 設計的功能,”他說。

垂直整合與分解

根據 Velaga 的說法,Nvidia 試圖實現的垂直整合與以太網相衝突。“以太網今天成功的全部原因是它是一個非常开放的生態系統,”他說。

正因爲如此,Nvidia 的 Spectrum-X 可能被證明對雲提供商來說是一個艱難的銷售,雲提供商傾向於盡可能避免供應商鎖定。他們強烈希望避免這種情況,導致廣泛採用與供應商無關的網絡操作系統,如 SONiC。這使他們能夠在任何兼容的交換機上運行他們的雲。

就其價值而言,Nvidia 的 Spectrum-4確實支持 SONiC,以及它自己的 Cumulus NOS 和 Linux Switch 驅動程序。但是,由於 Spectrum-X 平臺依賴於同時擁有 Spectrum-4 和 BlueField,因此您不能只將一個換成另一個兼容 SONiC 的开關或 DPU 而不會損失功能。

說到 DPU,許多最大的雲服務提供商已經擁有適合其環境的 SmartNIC。Amazon Web Services 擁有 Nitro,Google 與 Intel 共同开發了基於 ASIC 的 SmartNIC,Microsoft在 1 月份收購了 Fungible 。這些設備對雲提供商來說非常有價值,因爲它們允許他們卸載常見的網絡、存儲和安全工作負載——釋放 CPU 來運行租戶工作負載。

Shainer 說這完全沒問題。他認爲雲提供商可以使用他們現有的 DPU 來管理他們的基礎設施和控制南北流量,並使用 Nvidia 的 BlueField-3 來控制集羣中節點之間的東西向流量。

他補充說,也沒有什么能阻止人們將 Nvidia 的交換機或 DPU 作爲獨立產品進行部署。

“如果有人想使用我們的交換機並構建他們自己的東西,我們非常歡迎。如果有人想使用我們的 DPU 並使用其他人的交換機,當然 - 去吧。你可以自己开發這些東西,”Shainer 說。“但是,如果你想獲得完全優化的東西,全堆棧......並在四個星期而不是六、七或八個月內啓動系統?無價之寶。”

Broadcom 的 Velaga 不太確定客戶會如何接受這個想法。“很難說在一個一切都被分解的世界裏,他們將如何銷售垂直集成以太網解決方案的價值。” 

 

追加內容

本文作者可以追加內容哦 !

0/100