0
| 本文作者: 成妍菁 | 2026-03-27 17:17 |
“Token每兩周翻一倍”,AI infra 正在被重寫”。
“這種增長速度,在人類歷史上都很少見?!?/p>
這是無問芯穹CEO夏立雪對當(dāng)下AI行業(yè)最直觀的感受。
“養(yǎng)蝦”成潮流后,AI產(chǎn)業(yè)進(jìn)入到一個更有意思的變化:需求側(cè)反向重塑 AI 基礎(chǔ)設(shè)施。
隨之而來的是,Token調(diào)用量暴漲、算力供需錯配、系統(tǒng)架構(gòu)承壓,這些原本屬于底層的問題,正成為行業(yè)發(fā)展的關(guān)鍵變量。
3月27日,在2026中關(guān)村論壇年會——AI開源前沿論壇上,由月之暗面創(chuàng)始人楊植麟領(lǐng)銜主持,智譜華章CEO張鵬,無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪,小米MiMo大模型負(fù)責(zé)人羅福莉,香港大學(xué)助理教授&博士生導(dǎo)師、Nanobot團(tuán)隊(duì)負(fù)責(zé)人黃超同臺,圍繞當(dāng)下智能體浪潮、AI Infra的演進(jìn)方向等議題展開深度對話。
作為基礎(chǔ)設(shè)施層的代表,夏立雪從Token供給與產(chǎn)業(yè)可持續(xù)發(fā)展的視角,分享了對這一輪AI變革的觀察與思考。
Token爆發(fā):像極了3G時代的流量
在夏立雪看來,Token 不再只是一個計(jì)費(fèi)單位,而正在成為類似“電力”“流量”的基礎(chǔ)生產(chǎn)要素。
他將這一階段類比為3G時代初期。當(dāng)年移動互聯(lián)網(wǎng)剛剛普及時,用戶很快發(fā)現(xiàn)每月100MB流量遠(yuǎn)遠(yuǎn)不夠用,需求迅速釋放,最終催生出整個移動互聯(lián)網(wǎng)生態(tài)。
“現(xiàn)在Token的狀態(tài)是一樣的?!彼f,“我們甚至在開玩笑,未來手機(jī)可能會有兩張卡,一張是流量卡,一張是Token卡?!?/p>
但與流量不同的是,Token的增長背后,不只是“用得更多”,而是使用方式發(fā)生了根本變化。
隨著 Agent 的出現(xiàn),AI開始從“回答問題”走向“執(zhí)行任務(wù)”。一個復(fù)雜任務(wù)可能包含多輪推理、多次工具調(diào)用、多個子任務(wù)協(xié)同,這些都會顯著提升Token消耗。
與此同時,并發(fā)能力也在發(fā)生變化:
“一個Agent可以一秒鐘起1000個任務(wù),沒有人類工程師能做到?!?/p>
圍繞 Token ,新的產(chǎn)業(yè)分工也在逐漸清晰。夏立雪將AI產(chǎn)業(yè)的核心拆分為三個要素:模型的智能性、從資源到 Token 的轉(zhuǎn)化效率、資源規(guī)模。
三者共同決定整個系統(tǒng)的產(chǎn)出能力。
“模型廠商解決的是智能性的問題,而我們更關(guān)注的是生產(chǎn)效率——怎么把能源、算力轉(zhuǎn)化為更多、更高質(zhì)量的 Token ?!?/p>
在這個框架下,無問芯穹將自身定位為“ Token工廠 ”:通過軟硬件協(xié)同、資源整合與調(diào)度優(yōu)化,把分散的算力資源轉(zhuǎn)化為可用的Token供給,并盡可能提升單位資源的產(chǎn)出效率。
基礎(chǔ)設(shè)施重構(gòu):從“服務(wù)人類工程師”到“服務(wù)AI”
如果說Token的爆發(fā)是表象,那么更深層的變化在于:現(xiàn)有基礎(chǔ)設(shè)施的設(shè)計(jì)前提,正在被打破。
“過去我們服務(wù)的是CTO,是開發(fā)者,但未來的客戶,其實(shí)是AI,是Agent?!毕牧⒀┱f道。
人類工程師的工作節(jié)奏是串行的,而Agent具備高度并發(fā)能力;人類的響應(yīng)速度是分鐘級,而AI的反饋是秒級甚至毫秒級。這意味著,原本圍繞“人”的行為模式構(gòu)建的系統(tǒng),在面對AI時會迅速成為瓶頸。
夏立雪對雷峰網(wǎng)(公眾號:雷峰網(wǎng))表示,基礎(chǔ)設(shè)施要適應(yīng) AI 超出人類的能力。
比如 Agent 可以瞬間發(fā)起上千個并發(fā)任務(wù),這種規(guī)模和響應(yīng)速度,是人類工程師不具備的。所以底層系統(tǒng)必須支持更高并發(fā)、更快調(diào)度,比如毫秒級彈性、分布式任務(wù)協(xié)同。
如果基礎(chǔ)設(shè)施還是按照“人”的節(jié)奏設(shè)計(jì),就會成為瓶頸。
其次,基礎(chǔ)設(shè)施本身必須具備自我進(jìn)化能力。
夏立雪提到, AI 的需求變化非常快,今天和明天可能完全不一樣。所以Infra不能是靜態(tài)系統(tǒng),而是要能夠持續(xù)迭代。我們現(xiàn)在也在基礎(chǔ)設(shè)施里引入 AI 能力,讓AI參與運(yùn)維、調(diào)度、優(yōu)化,甚至像一個“CEO”一樣去協(xié)調(diào)多個Agent之間的協(xié)作。
從這個角度看,未來的基礎(chǔ)設(shè)施不是簡單支撐AI,而是和AI深度融合的——“你中有我,我中有你”。
這一判斷,也解釋了無問芯穹當(dāng)前的技術(shù)路徑:通過打通不同芯片架構(gòu)、整合分散算力資源,并在系統(tǒng)層引入AI能力,實(shí)現(xiàn)資源調(diào)度與系統(tǒng)優(yōu)化的持續(xù)進(jìn)化。
“我們希望做到的是,把容器、調(diào)度這些能力做到毫秒級彈性,去適應(yīng)AI的行為方式?!毕牧⒀┱J(rèn)為。
供需錯配與 Token 經(jīng)濟(jì)學(xué):一場尚未完成的體系構(gòu)建
盡管需求在快速增長,但當(dāng)前行業(yè)面臨的依舊是供需之間的結(jié)構(gòu)性錯配。
一方面,高端算力資源供不應(yīng)求;另一方面,大量“可用但未被充分利用”的資源處于閑置狀態(tài)。
“大家都在用最優(yōu)質(zhì)的資源,但其實(shí)有很多資源是可以被用起來的。”
在夏立雪看來,這種現(xiàn)象并不意外。任何新興產(chǎn)業(yè)在早期,都會集中使用最優(yōu)資源完成突破,但隨著規(guī)模擴(kuò)大,必然走向分層與分化。
“一個成熟的產(chǎn)業(yè),不可能只有最頂級的產(chǎn)品和最頂級的資源?!?/p>
這也意味著,低端算力、非主流芯片、延遲較高的集群,并非“無效供給”,而是尚未被正確匹配的資源。
無問芯穹的一個重要方向,就是通過調(diào)度與系統(tǒng)優(yōu)化,讓這些資源找到適合的應(yīng)用場景,比如離線任務(wù)、低實(shí)時性需求等,從而緩解整體供需壓力。
與此同時, Token 價格的變化,也成為市場的重要信號。
面對各家云廠商的提價現(xiàn)象,夏立雪的判斷是:“提價本質(zhì)上說明,這件事情在用戶側(cè)產(chǎn)生了價值。”
在他看來,當(dāng)前行業(yè)的一個關(guān)鍵問題,并不是“有沒有價值”,而是ROI是否跑通。
一方面,AI已經(jīng)可以替代部分人類勞動,例如助理型工作;另一方面,這些能力往往依賴高成本模型與算力,使得投入與產(chǎn)出未完全匹配。
“模型廠商解決的是這個崗位存不存在,而我們要解決的是,這件事情能不能以更高效率完成,讓它的成本和價值匹配?!?/p>
從更長周期來看,他認(rèn)為Token經(jīng)濟(jì)體系仍在形成之中。
與移動互聯(lián)網(wǎng)時代不同,AI的服務(wù)對象不僅是人,也包括AI本身,這意味著未來可能出現(xiàn)全新的價值交換方式。
夏立雪也表示,AI行業(yè)的健康發(fā)展必須打通完整的經(jīng)濟(jì)鏈路:將中國的能源轉(zhuǎn)化為算力,把算力轉(zhuǎn)化為Token,最終落地轉(zhuǎn)化為GDP。
通過軟硬件生態(tài)的底層打通,我們要打造屬于中國的特色Token經(jīng)濟(jì)學(xué),這不僅是盤活國內(nèi)算力,更是要復(fù)刻“Made in China”的奇跡,推進(jìn)“AI-Made in China” 。
當(dāng)中國龐大的能源與成本優(yōu)勢,通過高效率的Token工廠轉(zhuǎn)化為優(yōu)質(zhì)、穩(wěn)定的服務(wù)并輸出到全球時,中國也將成為新時代的“世界 Token 工廠”,為AI時代的全球分工貢獻(xiàn)不可替代的中國方案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。