0
“在當前的AI競賽中,不論是多模態還是基模廠商,一旦選定深耕賽道,其必然會走的道路便是設計極致適配自身業務的芯片底座。”芯片專家方志講到。
站在通用芯片廠商的視角,GPU的設計初衷,是為適配多元業務場景。全面兼容的代價,是大量冗余的邏輯單元與高度復雜的通用硬件架構。
為“泛用性”做出的架構取舍,使得通用化設計面臨天然妥協:計算陣列無法為特定AI任務做深度定制與極致調優,多芯片組網存在顯著的互聯通信開銷,每一項都直接影響整體效率。
對于效率的“不滿足”,讓云廠商開始自研芯片,擺脫英偉達的統治。
憑借場景與研發的閉環優勢,云廠商通過真實業務負載與模型運行數據,反向定義芯片設計,將AI高頻算子與核心計算邏輯直接固化為硬件電路,用硬件執行取代高級語言代碼,從根源上砍掉冗余開銷,實現效率最大化。
TPU和Gemini是海外實踐樣版,PPU和Qwen則是國產標桿方案。1月29日,平頭哥半導體公布PPU真身,“真武810E”高端AI芯片正式亮相。
雷峰網了解到,平頭哥早在2020年便秘密啟動了“真武810E”的研發,并于2022年底、2023年初,完成了研發和場景驗證,在此期間,其研發和驗證幾乎始終處在“只對內部開放”的狀態。
隨著真武810E正式亮相,阿里全棧自研的雙重閉環浮出水面。平頭哥實現了芯片從計算到存儲的覆蓋:從鎮岳510 SSD、倚天710 CPU到真武810E,底層算力芯片全面自研;而平頭哥、阿里云、通義實驗室的緊密耦合,形成“通云哥”黃金三角,搶占行業領先身位。
但雙重閉環只是起點,協同質變才是核心。
芯片、云平臺與模型如何產生“1+1+1>3”的協同效應?從底層硬件到上層應用的全棧自研體系,又將如何重構阿里的資本市場估值邏輯?
真武810E,懂AI云的芯片
“芯片廠商的業務,云廠商都有能力覆蓋;而云廠商卻能夠依托自身海量業務場景,率先發現系統痛點并給出解決方案,因此在架構創新上,頭部云廠商將始終走在行業前列。”云行業專家張峰分析到。
當下,MaaS 已然成為云廠商角逐的核心戰場,采用 “From cloud to chip”(從云到芯) 思路搭建自研算力基座,成為行業主流選擇。云廠商從自身業務場景出發定義芯片,讓最終解決方案天生具備大規模組網、集群調度、云上原生適配的先天優勢。
真武810E的大內存以及高速互聯,都展現了阿里自研芯片的優勢,其配備的96GB HBM2e高帶寬內存,可承載千億參數大模型訓推與長序列任務,3D堆疊設計更讓功耗、散熱表現良好,實現高頻穩定運行。
700GB/s片間互聯基于自研ICN鏈路與7個獨立ICN端口,集群加速比高、多卡擴展靈活,帶寬超越A800,配合平頭哥自研互聯加速庫,實現多卡協同工作,從而高效支撐模型訓推需求。
多卡互聯作為大模型時代高性能芯片的剛需,真武810E的PCIe 5.0×16接口帶來單向63GB/s、雙向128GB/s帶寬,是PCIe 4.0的2倍,能夠完美適配大模型海量數據吞吐,降低主卡間數據傳輸瓶頸。
功耗也日益成為高性能芯片繞不過的難題,真武810E的400W低功耗可實現更密集機柜部署,提高能效比,降低了數據中心運營成本與PUE,并通過冷板式液冷實現穩定控溫。
從核心參數來看,真武810E的綜合性能達到國際領先水平。據媒體報道,真武 PPU 累計出貨量已達數十萬片,超過寒武紀,在國產 GPU 廠商中屬于第一梯隊。
這種領先優勢,是“From cloud to chip” 路線的直接體現。依托芯片與業務場景的協同設計,真武810E從架構層面就與阿里生態深度綁定,規避了芯片與云平臺跨架構適配帶來的指令翻譯額外性能損耗,讓算力在最低損耗下釋放,成為“最懂”AI云的芯片。
雷峰網了解到,當前推理算力需求已占據AI應用企業70%的成本權重,在推理需求爆發的場景之下,算力好用的另一個重要體現是具備足夠的性價比。
真武810E通過搭載超大帶寬、高容量HBM2e內存,打破內存墻的限制,解決大模型推理場景下的內存瓶頸與帶寬壓力,讓大規模、高性價比的商業化推理業務進程加速。
完善的編譯器與算子優化能力,支持從底層硬件到上層大模型的全鏈路調優。開發者可針對實際業務場景,實現精細化算子適配與調度優化,進一步放大算力的效率優勢。
綜合以上強大性能,真武810E此次亮相,阿里“芯片、云平臺、模型”AI全棧自研生態的最新版圖呈現在所有人眼前。這套閉環體系所構筑的技術壁壘與商業價值,也讓阿里在全球 AI 算力競爭中的生態位優勢愈發清晰。
業務架構「雙閉環」,“co-design”讓阿里占據領先身位
“阿里正用極其清晰的戰略規劃,讓具備強耦合特性的架構閉環集中爆發,飛輪效應正式奏效。”一位行業人士點評道。
真武810E的公開,讓平頭哥“存儲-計算”芯片閉環與阿里全棧AI生態閉環正式顯現。
平頭哥,構建了“鎮岳510 SSD主控芯片+倚天710 CPU+真武810E”的協同閉環,打造了性能領先的國產自研算力體系。
全棧自研方案的首要價值在于實現供應鏈安全自主。以緩存場景為例,隨著Intel傲騰(Optane)逐步停產,市場面臨核心緩存介質供應斷檔的難題。而依托平頭哥自研芯片組合,搭配PSLC NAND閃存,可實現傲騰產品的國產化平替,用通用NAND閃存替代專屬新型存儲介質,應對供應風險與安全隱患。
另一項紅利,是硬件深度協同優勢。
自研CPU可根據業務需求,靈活選用RISC?V、ARMv9等合適指令集,甚至采用自主架構;GPU、SSD主控的通信協議、數據通路與緩存策略,均可與CPU進行統一設計與深度適配。一方面能夠縮短CPU與GPU間的PCIe傳輸延遲,優化異構算力調度效率,另一方面可讓SSD主控邏輯直接匹配CPU內存控制器與IO調度策略,降低讀寫放大,顯著提升4K隨機讀寫性能。
在阿里全景架構下,則實現了“平頭哥+阿里云+千問模型”黃金三角的閉環。
“以DeepSeek推出大型MoE模型為例,其本質便是在云端集群場景下實現了極致的模型與硬件的co-design,以此最大化釋放算力性能,而阿里的全棧自研將是更‘激進’的原生適配方案。”推理框架優化專家張濤解析到。
黃金三角閉環直接帶來的是阿里原生的緊耦合協同架構,這與過去一段時間英偉達+甲骨文+OpenAI的組合引領生AI發展的方式不同,跨企業的協同會帶來效率的損失,阿里則是和近來引發廣泛關注的谷歌一樣,在企業內部實現了三個環節的深度耦合。
底層算力層面,平頭哥在保證自研芯片高兼容性、廣場景覆蓋需求的前提下,團隊可緊密貼合阿里云智算集群的網絡拓撲、虛擬化架構與調度策略,開展芯片架構、IO通路、功耗控制等層面的定制化協同優化。
雷峰網了解到,真武810E已經在阿里云實現多個萬卡集群部署,這意味著阿里云為平頭哥系列芯片產品的規模化部署提供了領先一步的驗證平臺,能更高效地指導芯片產品的迭代與協同。
對通義大模型團隊而言,在自研芯片與阿里云的雙重加持下,千問模型的訓推效率實現了階梯式提升,能為企業客戶提供更穩定、更高效、更低TCO的云端推理服務。
其中,真武810E芯片針對Qwen3等主流MoE架構模型,完成了算子深度優化、張量并行調度、顯存智能調度等專項適配,可高效支撐千億乃至萬億參數大模型的分布式訓練與高并發推理,充分滿足千問系列在大規模計算場景下的性能需求。
對阿里云而言,在全球AI算力持續緊缺、算力成本高企、供應不穩定的行業背景下,自研芯片從供給側實現核心硬件自主可控,并降低了算力基礎設施的建設成本,還能為企業客戶提供更差異化的算力和模型服務選擇,進一步提升阿里云的市場競爭力。
據悉,平頭哥PPU芯片總出貨量達數十萬片,超過寒武紀,千問在中國企業級大模型調用市場中位居第一、阿里云季度營收達398.24億元,同比增長34%。
全景視角下,阿里已具備對標“英偉達+甲骨文+OpenAI”組合的生態化能力,在全球AI競爭中處于領先身位,這也重構了阿里的估值邏輯。
“通云哥”浮出水面,「AI工廠」重構阿里估值邏輯
長期以來,資本市場對阿里的認知,一直被“電商平臺”、“互聯網巨頭”等標簽所固化。這種單一化的刻板印象,簡化了對其價值的分析框架,也容易因忽視公司內部正在發生的深度業務變革,造成投資判斷上的偏差。
一個不容忽視的事實是:當行業內多數企業還在探索AI布局路徑時,阿里已憑借一系列前瞻性決策與精準卡位,完成全棧AI能力的構建,躋身全球頂級科技企業行列。
在全球科技巨頭的共識中,成為“AI工廠”就意味著掌握AI時代的“水電煤”。但設想與現實,存在巨大的落地鴻溝,阿里生態的閉環,絕非一日之功。
2018年,當絕大多數企業還沉浸在互聯網業務紅利時,阿里便已開啟了其面向AI的戰略布局:當年4月,阿里出手全資收購中天微;9月,整合中天微與達摩院芯片團隊,平頭哥半導體應運而生,業務布局前瞻性全面領先于當前備受關注的國產GPU四小龍。
大規模的芯片研發投入之下,阿里云不是只顧短期收益,投入大量資金研發HPN 7.0智算集群網絡架構,成為SIGCOMM歷史上首個AI智算集群網絡架構成果,支撐通義千問2.5版本中文性能成為世界頂尖模型。
2019 年,通義實驗室正式啟動大模型研發,阿里AI生態的“軟件攻堅”帷幕正式拉開。2021年,全球首個十萬億級參數大模型M6成功落地,如今,通義實驗室發布的千問大模型家族,已然躋身全球第一梯隊開源模型。
技術的深度,并非困在“自嗨式”的研發閉環里。
資深芯片專家徐東向雷峰網(公眾號:雷峰網)講述真武810E時,罕見地使用“好用”二字對一款國產芯片進行評價。
雷峰網了解到,真武810E重點拓展大型車企及金融行業。
這是基于行業頂層視角的戰略研判。互聯網賽道外,車企已成為云業務需求最旺盛的核心群體,絕大多數車企選擇“上云”而非“建云”。
另一方面,車企對于AI訓練的性能要求基本介于L20與H20之間的算力水平,而真武810E恰好精準匹配這一市場痛點,成為車企算力采購中的優選方案。
金融場景作為數據密集型行業,對算力的核心訴求在于“安全可控、低時延、高穩定”,同樣是國產芯片廠商打造“標桿案例”的優選領域。
雷峰網獲悉,廣西某銀行項目發布了數十臺算力服務器的招標需求,基于產品性能及業務適配性,對投標的國產芯片廠商進行測試,多家頭部國產芯片廠商投標,最終真武810E脫穎而出。
“這個案例沒有任何水分,真武810E確實有很強的競爭力。”一位全程參與項目實施的業內人士直言。
依托完整的AI全棧技術體系,阿里相關解決方案已在多個行業實現規模化落地驗證:服務小鵬汽車、國家電網、中科院、新浪微博等400余家行業標桿客戶。
從底層芯片研發到頂層場景應用,阿里始終堅持長期主義,錨定技術可行、商業可用的核心方向做出關鍵決策。憑借硬核技術對標能力與規模化落地成效,其技術版圖與商業價值已形成清晰佐證。
“重估阿里”不是口號,而是對其技術價值的“理性回歸”。
注:文中方志、張峰、張濤、徐東皆為化名。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。