成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    芯片 正文
    發私信給楊依婷
    發送

    0

    KV Cache需求暴漲32倍,AI如何重寫存儲產業鏈的「舊分工」?| MemoryS 2026觀察

    本文作者: 楊依婷   2026-04-10 15:55
    導語:“誰能解決AI時代數據搬運的功耗和延遲,誰就能定義下一個10年。”

    作者 | 楊依婷

    編輯 | 包永剛

    去年的CFMS|MemoryS峰會上,存儲廠商們討論的是:價格何時企穩、QLC何時上量、AI PC何時落地。彼時,“AI會讓存儲變得更基礎、更關鍵”,還更像是一種行業判斷,一種面向未來的趨勢預演。

    一年之后,站在MemoryS 2026的會場里,問題已經徹底變了。

    人們談論的不再只是位元成本、顆粒供給和容量節奏,而是GPU利用率、token成本、系統調度效率,甚至物理AI場景中的實時決策能力。那些原本屬于AI基礎設施和系統架構層面的議題,正在越來越頻繁地出現在存儲產業的討論中心。

    在傳統計算架構里,存儲的職責更多是“存”。數據被寫入、留存,在需要時調取,不需要時則靜靜停留在系統邊緣。它長期是BOM成本中的一項,是容量規劃的問題,而很少直接參與算力效率的定義。

    但在大模型訓練與推理時代,這一角色被徹底改寫。

    KV Cache的訪問延遲,開始直接影響token生成速率;Checkpoint的寫入效率,決定著GPU在訓練過程中的等待時間;SSD的IOPS密度,則進一步影響大模型推理場景下的并發能力和系統吞吐。

    存儲開始進入計算主路徑,它決定數據流動的速度,也在某種程度上決定GPU算力能否被充分兌現。而這,正在反向重塑整個存儲產業鏈的分工邏輯。

    存儲進入計算路徑,舊分工開始失效

    AI推理有一個被反復討論的瓶頸:KV Cache。

    大模型在處理長上下文時,需要把每一層、每一個token生成過程中的Key和Value結果臨時保存下來,以避免重復計算。上下文越長,并發越高,這部分緩存的體量就越驚人。

    當高帶寬顯存無法繼續承接,KV Cache只能向下一層存儲介質下沉,NVMe SSD由此正式進入大模型推理的實時數據路徑。

    如果說過去SSD的使命是“提升加載速度”,那么在AI時代,它開始直接約束或決定推理吞吐的上限。

    慧榮科技總經理茍嘉章的總結更為直接:“新一代存儲,正在從數據存儲進入計算存儲。”

    這句話幾乎點破了整個行業變化的本質。一旦存儲進入計算路徑,它就不再只是靜態保存數據,而是開始影響token生成效率:訪問時延影響輸出速度,IOPS密度決定并發能力,寫入效率左右Checkpoint節奏,最終共同作用于單位token成本。

    也正因如此,AI場景對存儲提出的要求,已經明顯超出了“標準顆粒 + 通用主控 + 標準模組產線”這套舊模式的能力邊界。

    2026年,全球也許沒有任何一款主流AI存儲產品能夠實現供需平衡。

    表面看,這是先進產能持續向高毛利AI產品傾斜,消費級市場被進一步擠壓;但更深層的問題在于,即便產能跟上,舊有分工模式也難以高效承接AI場景對定制化、快速迭代的需求。

    存儲廠商集體越界

    當存儲真正進入計算路徑,產業鏈上原本清晰的角色邊界開始松動:主控廠介入系統定義,模組廠延伸至固件與方案優化,各自補全過去并不屬于自己的能力版圖。

    以慧榮為例,傳統主控的核心任務,是管理閃存介質、優化讀寫效率,并在穩定性、兼容性和壽命之間尋找平衡。但在AI時代,這套能力模型已經不夠。

    如今,慧榮開始反復強調一種新的能力——性能動態調節。

    慧榮科技總經理茍嘉章在與雷峰網(公眾號:雷峰網)交流時多次強調,主控需要“根據工作負載、功耗和需求量,在動態中快速調整”。這已經不再是傳統意義上的硬件參數調優,而是直接響應英偉達新架構中“上下文內存存儲(Context Memory Storage)”對實時調度的需求。

    KV Cache需求暴漲32倍,AI如何重寫存儲產業鏈的「舊分工」?| MemoryS 2026觀察

    換句話說,主控正在從“閃存控制器”,演變為AI存儲系統里的調度層,它不只是負責把數據寫進去、讀出來,更開始參與數據在GPU、顯存和SSD之間的流動節奏定義。

    這種變化,也在推動主控廠進一步向下游延伸。

    慧榮正在積極與長江存儲聯合推進車規級方案,目標是在第三季度末至第四季度實現規模上量,直接供貨國內車廠。過去賣芯片的公司,如今越來越多地以“聯合方案提供方”的身份出現。

    這意味著主控廠的商業角色也在變化:一方面向上理解AI工作負載,把主控納入系統調度;另一方面向下輸出完整方案,從賣芯片走向賣系統能力。

    未來存儲產業的競爭,不再只發生在顆粒、主控或模組層,而是進一步延伸到封裝架構、異構互連和系統級協同,是生態、技術、產能、客戶、資本的綜合戰爭。

    端側AI反向定義存儲

    AI對存儲的重構,顯然不只發生在數據中心。

    另一條同樣重要的戰場正在端側迅速展開——AI PC、機器人、游戲掌機、智能眼鏡,乃至更多尚未被完全定義的新型終端,都在把存儲推向更核心的位置。

    正如眾多廠商在峰會上提到的,物理AI/端側AI將迎來更廣泛的發展,并帶來更智能化的體驗。而這些更新更好的體驗將帶來更多的產品溢價,足以抵抗存儲價格上漲的壓力。 “

    這句話背后,點出了端側AI最現實的商業邏輯:只要體驗提升足夠明顯,存儲成本就不再只是成本,而會轉化為產品價值的一部分。

    但與數據中心不同,端側AI面臨的不是單一性能問題,而是高度碎片化的場景挑戰。

    一臺AI PC,需要在本地運行大模型,對存儲的核心訴求是大容量 + 高速讀取;一臺機器人,需要在高震動、高移動性的復雜環境中持續穩定運行,同時還要支持后期擴容;一副智能眼鏡,則把需求進一步推向極致的小尺寸、低功耗和高集成度。

    可插拔、可擴容、高抗震、小尺寸、高容量——這些要求往往彼此拉扯,很難通過同一款標準化模組同時滿足。

    這也是為什么,端側AI正在比數據中心更早倒逼存儲方案走向場景化重構。

    佰維給出的解法非常具有代表性。

    針對機器人場景,其推出了一套 “BGA SSD + Mini SSD” 的組合方案:BGA SSD直接焊接在主板上,以更強抗震性承擔系統盤角色,保障操作系統和本地AI模型穩定運行;Mini SSD則采用類SIM卡槽設計,支持用戶無工具插拔,作為數據盤解決嵌入式設備后期無法擴容的長期痛點。

    這套方案的關鍵,并不只是形態創新,而是它背后的產品邏輯:把“穩定”和“靈活”拆分為兩個獨立部件,并分別做到最優。這本質上已經不是傳統意義上的“賣一塊SSD”,而是在重新定義機器人存儲架構。

    更值得關注的是,佰維的動作并未停留在單一產品層面。

    它正在推動Mini SSD從企業級方案,進一步走向行業標準。通過聯合產業鏈上下游成立IP公司,并同步制定激勵機制和權益金分配規則,佰維試圖把“可插拔存儲”推進為下一代AI終端的標準能力。

    其目標場景并不局限于機器人,而是進一步覆蓋AI PC、游戲掌機等多類設備——這些終端當前仍采用不同形態的本地存儲方案,而Mini SSD的野心,是用統一接口去重新組織它們。

    換句話說,它爭奪的不只是產品份額,而是下一代端側AI設備的標準定義權。

    而在這個過程中,過去那套面向PC和手機時代的標準化存儲模組,已經越來越難承接碎片化、多形態、高迭代的終端需求。

    更深層的變化在于,設備與存儲之間的關系,正在發生方向性的逆轉——過去,是設備定義存儲:設備要做什么,存儲就被動適配什么。

    而現在,隨著本地AI能力越來越依賴容量、帶寬、功耗和形態協同,存儲開始反過來影響設備形態、產品定義,乃至最終用戶體驗。

    下一戰:功耗、延遲、智能

    AI最大的痛點并非算力不足,而是數據在存儲與計算單元間的頻繁搬運,降低系統效率。如何減少數據在存儲與計算單元之間的頻繁搬運,已成為行業共同攻關的核心命題。

    這句話放在一年前,可能還有點抽象。但經過過去一年產業鏈上下游一連串幾乎同步發生的變化之后,它開始落到一個個極其具體的技術指標上:KV Cache的訪問時延、Checkpoint的寫入效率、單位token成本等等。

    過去十年,產業比拼的是單位容量的成本;下一個十年,勝負手將取決于數據在計算與存儲之間流動的效率、功耗與智能。

    至于那些仍固守在舊分工里、只盯著顆粒價格波動的玩家,留給他們的時間,或許真的不多了。

    雷峰網

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說