0
| 本文作者: 劉伊倫 | 2026-04-10 18:27 |

“全球半導體存儲器的市場規模預估將突破6000億美元。”
MemoryS 2026上,深圳市閃存市場資訊有限公司總經理邰煒拋出這一數字,彰顯著存儲行業的底層邏輯已悄然改變:周期性行情退場,AI主導的新范式降臨。
引爆這場變革的,是AI推理對存儲的指數級需求:單請求情況下,若上下文從4K Token擴展至128K Token,KV緩存會膨脹32倍,若是100個并發請求,緩存需求則達TB級。
面對這種需求量,HBM已無力承載,這就決定了KV緩存開始大規模向企業級SSD遷移。
疊加NL HDD產能缺口帶來的替代效應,多重變量共振,企業級SSD正在成為2026年NAND閃存最大的應用市場。
“企業級SSD不再只是容量載體,而成了整個算力架構里突破性能瓶頸的關鍵。”邰煒說到。
變局之下,AI對企業級SSD的標準無限拔高,高可靠性、低時延、高壽命既是定價標尺,也是廠商廝殺的核心戰場。
誰能破解“AI時代數據搬運的功耗與延遲”,誰就將定義下一個十年。
超級周期已啟幕,存儲廠商各有出招。
不做GPU的「配角」,SSD開始介入AI計算
當AI推理規模化爆發,存儲與計算的關系正在被重新定義:SSD不再只是數據的“倉庫”,而是影響Token生成效率的關鍵變量。
這種定位的躍遷,正在倒逼存儲廠商重新思考自身的技術縱深。
以大普微為例,為了實現更快的Token生成與響應,其通過Fast SSD與TLC SSD的產品組合,打造高IOPS和低時延的數據供給能力,從而節省算力和成本。
更深一層的變化在于,存儲開始介入計算的數據流調度。
大普微通過透明壓縮技術實現將KV Cache的數據無損壓縮21%以上,從而等效提升27%的帶寬,帶來直接的性能與用戶容量收益。
與此同時,FDP(靈活數據放置)技術的引入,讓SSD可以根據數據生命周期進行分組管理,從而降低寫放大與延遲波動,為GPU提供可預期的數據供給節奏。
這些技術點的串聯,勾勒出一個清晰的演進方向:SSD正在從“存儲設備”進化為“AI數據調度節點”,它不僅要存得快、存得多,還要存得“聰明”,能在正確的時間把正確的數據送到正確的位置。
更值得關注的是其產品節奏與AI算力迭代的同頻。
“目前,企業級SSD的市場大概能按照容量進行劃分,4TB-32TB是TLC SSD的規模甜點,30TB以上則是QLC SSD的主力區間,大普微今年推出245TB的產品,明年就會設計為512TB。”大普微董事長楊亞飛對雷峰網(公眾號:雷峰網)表示。
這種“容量翻倍”的產品策略,與AI模型參數規模的增長曲線形成了共振,為下一階段產品的放量埋下基礎。

SSD的競爭核心是讓GPU「不空轉」
當SSD開始承擔KV Cache卸載、AI數據湖、推理緩存等任務,它既要提供接近內存級的延遲穩定性,又要具備遠高于內存的容量密度和成本優勢。
在這種變化下,SSD的評價體系也隨之重構。
過去行業更強調帶寬、IOPS與壽命,在AI場景中,長尾延遲控制、QoS一致性以及每瓦性能開始變得同樣關鍵。
對大型算力集群來說,一塊SSD的價值不只是單盤性能有多高,而在于它能否在復雜負載下保持穩定響應,避免GPU因等待I/O而“空轉”。
也正是在這樣的背景下,企業級存儲廠商開始向系統能力延伸。
以憶恒創源為例,其核心策略并不是簡單堆疊硬件參數,而是通過固件算法和系統級調度,把不同來源的控制器與NAND顆粒調校成更適合AI負載的產品形態。
在大規模線上部署中,依托國內大規模、高度復雜的AI與互聯網生態,在極端且高頻的業務壓力下,其SSD的平均無故障時間(MTBF)已經達到約1500萬小時,產品的穩定性有可觀的場景及數據背書。
在AI負載環境下,通過固件調度優化和延遲控制,其隨機讀延遲可以壓縮至50微秒級,從而減少推理場景中GPU等待I/O的時間。
并且,通過對固件和硬件架構的協同優化,高密度QLC在AI數據湖和推理場景中既能提供更大的容量密度,也能維持穩定的性能表現。
對于需要存儲海量訓練數據或推理緩存的集群而言,這類產品正在成為實現“全閃數據中心”的關鍵一步。

AI重構存儲路徑:企業級SSD從「容量介質」轉向「算力系統變量」
在這一輪由 AI 推動的存儲重構中,一個更清晰的共識正在形成:企業級SSD的價值錨點,正在從“單點性能指標”轉向“系統確定性”。
無論是KV Cache大規模卸載帶來的架構遷移,還是QLC在高密度存儲中的重新定位,抑或是固件層對延遲、QoS 與功耗的持續壓縮,本質上都在指向同一個問題:存儲不再只是容量與帶寬的提供者,而是決定算力是否能夠被穩定釋放的基礎變量。
在這個意義上,行業的競爭邊界也在悄然上移。
單一硬件能力的差異正在被系統級能力所稀釋,真正拉開差距的,是誰能更早理解AI工作負載的變化,并將其轉化為可規模化、可持續優化的工程體系。
當算力、存儲與網絡進一步融合,數據中心的邏輯也將從“資源堆疊”走向“效率組織”。
而存儲,正站在這一輪重構的交匯點上。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。