6月21日消息,賽迪顧問數(shù)據(jù)顯示,2020年中國DPU產(chǎn)業(yè)市場規(guī)模為3.9億元,預(yù)計到2025年中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元,年復(fù)合增長率高達170.6%,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,年復(fù)合增長率為51.73%。
DPU,即Data Processing Unit,是以數(shù)據(jù)為核心的專用處理器,被稱為是數(shù)據(jù)中心中CPU、GPU之后的第三顆主力芯片。
那么,在AI催生下算力與數(shù)據(jù)爆發(fā)的新階段,DPU對更強勁的算力意味著什么?在AI時代該如何重新定義?

“搶灘”DPU
當前,DPU的產(chǎn)業(yè)價值已成共識。2023年10月,工信部等六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》強調(diào),DPU在提升算力效率、優(yōu)化算力質(zhì)量、促進綠色低碳算力發(fā)展等方面的關(guān)鍵作用。這一政策的出臺,標志著DPU在國家戰(zhàn)略中的地位得到了正式確認。
清華大學教授、中國工程院院士鄭緯民在中科馭數(shù)2024產(chǎn)品發(fā)布會致辭中表示,芯片是算力的核心,是算力提升的關(guān)鍵所在。DPU芯片被稱為數(shù)據(jù)中心中繼CPU、GPU之后第三顆主力芯片,它作為數(shù)據(jù)處理器承擔著數(shù)據(jù)網(wǎng)絡(luò)傳輸、存儲、計算、安全等任務(wù),是重要的新型算力基礎(chǔ)設(shè)施。
中科馭數(shù)CEO鄢貴海表示,如果把CPU比做大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞。CPU承載了應(yīng)用生態(tài),決定了計算系統(tǒng)是否可以通用;GPU提供了高密度各類精度的算力,決定了系統(tǒng)是否有足夠的“力量”;DPU負責數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。“三U一體”(CPU、GPU、DPU)成為主流算力節(jié)點發(fā)展趨勢。

在國際上,英偉達、英特爾、AMD、微軟等廠商都已經(jīng)積極布局DPU。NVIDIA收購Mellanox后,憑借原有的ConnectX系列高速網(wǎng)卡技術(shù),推出其BlueFicld系列DPU,成為DPU賽道的標桿。AMD相繼收購算法加速芯片頭部廠商的Xilinx和Pensando的目的更明顯。繼Intel收購Xilinx的競爭對手Altera后,在通用處理器的基礎(chǔ)上,進一步完善硬件加速能力,Intel 2021年6月新發(fā)布的IPU產(chǎn)品(可以被視為Intel版本的DPU),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。幾乎同一時間,Marvell發(fā)布了OCTEON10 DPU產(chǎn)品,不僅具備強大的轉(zhuǎn)發(fā)能力,還具有突出的AI處理能力。
國內(nèi)GPU廠商在加速攻堅之際,國內(nèi)DPU賽道也站滿了各路玩家,如移動云、天翼云、華為等通信企業(yè),阿里云、騰訊、百度、字節(jié)跳動等互聯(lián)網(wǎng)巨頭,以及一些DPU創(chuàng)業(yè)公司中科馭數(shù)、星云智聯(lián)、云脈芯聯(lián)、云豹、大禹智芯、益思芯、芯啟源等均在各展神通。

毋庸置疑,DPU產(chǎn)業(yè)已經(jīng)成為國內(nèi)外競爭的新焦點,在未來數(shù)據(jù)中心、智算中心等高帶寬、低延遲、高吞吐率產(chǎn)品都將發(fā)揮重要作用,為“東數(shù)西算”、算力網(wǎng)絡(luò)等重要新型算力基礎(chǔ)設(shè)施建設(shè)提供核心組件。
重新定義DPU
DPU是當下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比數(shù)據(jù)網(wǎng)絡(luò)的高鐵時代,已經(jīng)不僅僅是連通城市問題,而是徹底重構(gòu)了地理位置的邏輯距離。
從國內(nèi)來看,中科馭數(shù)是率先完成三代DPU芯片研發(fā)迭代,并成功實現(xiàn)規(guī);逃玫腄PU廠商。中科馭數(shù)的目標是為算力基礎(chǔ)設(shè)施提供一流的DPU產(chǎn)品,解決算力資源的彈性擴展、高效互連、加速計算、統(tǒng)一運維等關(guān)鍵問題,打通數(shù)據(jù)中心算力的“堰塞湖”。
其中,6月19日,正式發(fā)布的國內(nèi)首顆量產(chǎn)全功能DPU算力芯片——中科馭數(shù)第三代DPU芯片K2-Pro DPU芯片,是專為破解大規(guī)模數(shù)據(jù)中心性能瓶頸而生的高效能數(shù)據(jù)處理芯片,采用自主研發(fā)的KPU架構(gòu),集網(wǎng)絡(luò)、存儲、安全及計算等多業(yè)務(wù)卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網(wǎng)絡(luò)帶寬,具備高度可編程性,確保了系統(tǒng)的靈活擴展性,為數(shù)據(jù)中心的業(yè)務(wù)增長和算力擴容提供堅實基礎(chǔ)。在處理復(fù)雜任務(wù)時,K2-Pro相比上一代芯片能耗降低30%。作為一款純國產(chǎn)的高性能解決方案,K2-Pro適用于云計算、智能計算、及高性能計算等領(lǐng)域,助力數(shù)據(jù)中心應(yīng)對日益增長的規(guī)模和性能需求。

此外,在2025年,中科馭數(shù)將完成K3芯片的發(fā)布,采用最新KPU架構(gòu)以及KISA 2.0指令集,集成RISC-V輕量級控制核,處理帶寬將是K2-Pro的四倍,達到800G,延遲低于1微秒,功耗比K2-Pro下降40%。中科馭數(shù)還將在算力基礎(chǔ)設(shè)施領(lǐng)域布局“芯云計劃”。
基于此,中科馭數(shù)已經(jīng)不單單將DPU視為單一芯片,而是從三個維度重新定義其價值。第一,架構(gòu)決勝,用最先進的芯片架構(gòu)來重新定義DPU芯片架構(gòu)。第二,軟件護城,用最高兼容性來重新定義DPU的軟件系統(tǒng)。第三,平臺上門,用最低的成本讓客戶接入DPU規(guī);渴鹋c業(yè)務(wù)驗證。
歷時六年,立志成為有信念、有追求、有敬畏、有技術(shù)的“四有新人”的中科馭數(shù)清晰地知道,趨勢并不能確保中科馭數(shù)的成功,時代只會給真正創(chuàng)新的企業(yè)以回報,只會給效率至上的企業(yè)生存空間。馭數(shù)人有一個執(zhí)念,就是不僅要把DPU做成一個產(chǎn)品,更要把“馭數(shù)”做成一個品牌,做成一個在數(shù)字時代助力數(shù)字中國的品牌,成為這個時代趁勢而上的企業(yè)。
“革命性的產(chǎn)品,絕不僅僅是指標升級,而是深度契合了技術(shù)趨勢的發(fā)展!臂迟F海表示,希望人們以后像記住Intel=CPU,NVIDIA=GPU一樣,記得馭數(shù)=DPU。

DPU產(chǎn)業(yè)應(yīng)用落地開花
目前,DPU系列產(chǎn)品高效賦能各行各業(yè),已成功為金融、通信、交通、數(shù)據(jù)中心等眾多領(lǐng)域提供算力底座支持,DPU產(chǎn)業(yè)已經(jīng)到了應(yīng)用落地開花的關(guān)鍵階段。
首先,在云計算方面。頭部云廠商紛紛啟動自研芯片計劃,而且研發(fā)重點都是面向數(shù)據(jù)處理器的高性能專用處理器芯片,希望以此改善云端的服務(wù)器成本結(jié)構(gòu),提高單位能耗的性能水平。數(shù)據(jù)研究預(yù)測,DPU在云計算市場的應(yīng)用需求最大,且市場規(guī)模隨著云計算數(shù)據(jù)中心的迭代而增長,到2025年,僅中國的市場容量都將達到40億美元的規(guī)模。
其次,在智算中心領(lǐng)域。以AIGC應(yīng)用來看,DPU在智算中心中的關(guān)鍵作用與價值主要有支持超大規(guī)模組網(wǎng)算力互連、支持100G+超高帶寬、通過使用RDMA來提供模型訓練所需超低時延和抖動、其NVMe- oF技術(shù)可提供更高效的存儲讀取和處理能力等四方面。
再次,在5G通信領(lǐng)域。在5G通信網(wǎng)絡(luò)快速發(fā)展的過程中,算力和網(wǎng)絡(luò)融合發(fā)展需要更加綠色高效的數(shù)據(jù)處理硬件加速技術(shù),亟待DPU提升系統(tǒng)性能。DPU將在高性能數(shù)據(jù)處理、低延遲數(shù)據(jù)傳輸、網(wǎng)絡(luò)管理、存儲,以及安全等基礎(chǔ)設(shè)施底層建設(shè)發(fā)揮關(guān)鍵作用。DPU通過接手CPU不擅長的網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)加解密等數(shù)據(jù)處理任務(wù),不僅可以提高網(wǎng)絡(luò)傳輸效率,而且釋放了CPU算力資源。在新型算力DPU的加持下,能夠提供靈活高效的硬件加速服務(wù),支持云基礎(chǔ)設(shè)施層功能卸載,云邊協(xié)同、云網(wǎng)一體都將逐步實現(xiàn)。
最后,在金融行業(yè)。金融信創(chuàng)已步入深水區(qū),由“邊緣替代”邁向“核心替代”。核心交易系統(tǒng)對網(wǎng)絡(luò)時延的需求從毫秒級提升到微秒甚至納秒,低時延網(wǎng)絡(luò)領(lǐng)域的核心設(shè)備長期被國外廠商Solarflare與Mellanox壟斷,時延和安全問題成了制約銀行、證券、期貨等行業(yè)發(fā)展的難點之一。而自主研發(fā)的低時延網(wǎng)絡(luò)DPU卡構(gòu)建超低時延網(wǎng)絡(luò),可支撐金融交易核心鏈路從底層硬件到上層應(yīng)用系統(tǒng)具備超低時延、低抖動、完全自主可控等特性,在超低時延網(wǎng)絡(luò)領(lǐng)域真正打破壟斷,實現(xiàn)國產(chǎn)升級替代。
值得一提的是,DPU的潛在市場非常巨大。雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)還相比國外一線廠商還有差距,但是在DPU架構(gòu)的理解上還是有獨到見解的,而且我國目前在數(shù)據(jù)中心領(lǐng)域,無論是市場規(guī)模還是增速,特別是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢。國內(nèi)廠商有望充分利用這一“應(yīng)用勢能”,加快發(fā)展步伐,在DPU這個賽道與國外廠商逐鹿中原。