成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    業(yè)界 正文
    發(fā)私信給梁丙鑒
    發(fā)送

    0

    性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

    本文作者: 梁丙鑒   2025-09-29 16:12
    導(dǎo)語:打響低成本推理之爭(zhēng)。

    雷峰網(wǎng)訊 幾乎沒有預(yù)熱,馬斯克不聲不響把模型調(diào)用成本砍掉 98%。

    作為低成本推理模型的最新進(jìn)展,xAI 于上周五發(fā)布了其旗艦?zāi)P偷妮p量化版本 Grok 4 Fast。

    通過大規(guī)模強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)智能密度最大化,Grok 4 Fast 在基準(zhǔn)測(cè)試上實(shí)現(xiàn)了與 Grok 4 相當(dāng)?shù)谋憩F(xiàn)。同時(shí)由于推理任務(wù)的平均 token 消耗減少了 40 %,xAI 此次更新將前沿模型的調(diào)用成本大幅降低。

    據(jù)官方測(cè)算,Grok 4 Fast 單個(gè)推理任務(wù)的成本最低可降至原來的 2%。

    這已經(jīng)是一個(gè)可以改寫大模型競(jìng)爭(zhēng)規(guī)則的數(shù)字。

    端到端強(qiáng)化學(xué)習(xí)

    如果要給 Grok 4 Fast 三個(gè)關(guān)鍵詞,那應(yīng)該是 AI 搜索、上下文窗口和統(tǒng)一模型架構(gòu)。

    xAI 在一篇博客中介紹,Grok 4 Fast 擁有原生的工具調(diào)用能力,這是指 Grok 4 Fast 通過端到端工具使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,在決定何時(shí)調(diào)用代碼或網(wǎng)頁等工具方面表現(xiàn)出色。

    由于背靠 X 平臺(tái)的豐富數(shù)據(jù),此舉為 Grok 4 Fast 在自主探索能力方面帶來的優(yōu)勢(shì)更為突出。該模型能夠無縫瀏覽網(wǎng)頁和 X 平臺(tái),利用實(shí)時(shí)數(shù)據(jù)增強(qiáng)查詢,同時(shí)支持跳轉(zhuǎn)鏈接獲取媒體內(nèi)容,并以極快速度綜合生成結(jié)果。

    對(duì)于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基準(zhǔn)測(cè)試中,表現(xiàn)優(yōu)均于 Grok 4。

    在 LMArena 的搜索競(jìng)技場(chǎng)中,Grok 4 Fast 以 1163 分位列第一,力壓此前 OpenAI 領(lǐng)先的 o3-websearch,更是優(yōu)于 gpt-5-search 和 grok-4-search。在文本競(jìng)技場(chǎng)中,Grok 4 Fast 則排名第八,以一分之差險(xiǎn)勝 grok-4-0709版本。

    可以看到,Grok 4 Fast 已經(jīng)顯著優(yōu)于同等量級(jí)的模型,而在搜索相關(guān)任務(wù)中,模型參數(shù)造成的差距則可以被強(qiáng)化學(xué)習(xí)帶來的推理效率和智能密度所追平甚至跨越。

    性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

    即將和 Grok 4 Fast 同期推出的是其兩個(gè)版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即長鏈?zhǔn)剿季S和快速響應(yīng)兩種推理模式,均具備 200 萬 token 的上下文窗口。

    值得一提的是,Grok 4 Fast 采用了統(tǒng)一模型架構(gòu)。

    此前,在不同推理模式下應(yīng)用不同的獨(dú)立模型已經(jīng)成為業(yè)界通行的選擇。對(duì)于僅需要簡(jiǎn)單回答和大量推理的任務(wù),手動(dòng)切換模型的開關(guān)對(duì)于各個(gè)模型廠商來說幾乎已是標(biāo)配。

    而 Grok 4 Fast 此次更新引入了統(tǒng)一架構(gòu),其中 reasoning(長鏈?zhǔn)剿季S)和 non-reasoning(快速響應(yīng))兩種模式由同一模型權(quán)重處理,推理過程中通過系統(tǒng)提示進(jìn)行引導(dǎo)。

    這種設(shè)計(jì)進(jìn)一步降低了端到端延遲和 token 成本。可以預(yù)見的結(jié)果是,在壓縮調(diào)用成本之外,Grok 4 Fast 距離那些對(duì)即時(shí)響應(yīng)存在高需求的場(chǎng)景也更近了一步。

    SOTA 性價(jià)比

    SOTA 一日三變,市場(chǎng)對(duì)模型性能擠牙膏的戲碼早就沒有了耐心。

    xAI 也深知這一點(diǎn),所以比起循例公布的基準(zhǔn)測(cè)試結(jié)果,此次更新真正的“軍火展示”其實(shí)是下面這兩張圖。

    性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

    性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

    Grok 4 Fast 的 token 效率提升了 40%,加之每個(gè) token 的大幅降價(jià),最終結(jié)果是開發(fā)者的模型調(diào)用成本顯著降低。而此時(shí)的模型性能,仍可以基本保持在 Grok 4 的水平。

    根據(jù) Artificial Analysis 的獨(dú)立評(píng)測(cè),Grok 4 Fast 相較于其它公開可用的模型,展現(xiàn)出了 SOTA 級(jí)別的性價(jià)比。

    在官方博客中,xAI 將 Grok 4 Fast 稱為“低成本推理的最近進(jìn)展”。98% 的成本壓縮一出,馬斯克就差把“我們最便宜大碗”寫在臉上。雖然沒能在追求智能上限的路上甩開友商,但“誰都能用”是在“比誰都強(qiáng)”之外,另一種打遍天下的可行方案。

    在此前的很長一段時(shí)間里,大模型都是一場(chǎng)暴力美學(xué)的軍備競(jìng)賽,更大的參數(shù)規(guī)模、算力消耗和更強(qiáng)的推理能力成為了模型廠商競(jìng)爭(zhēng)的硬指標(biāo)。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是這種極致性能追求下的產(chǎn)物。

    然而實(shí)驗(yàn)室之外的世界沒有那么關(guān)注技術(shù)邊界,當(dāng)大模型以一款產(chǎn)品的角色面向市場(chǎng),過去的技術(shù)路線也在應(yīng)用場(chǎng)景之前留下了一道道坎,其中最為明顯的就是昂貴的推理成本和漫長的響應(yīng)時(shí)間。

    相比之下,曾經(jīng)被視為閹割性能的小模型,如今卻正在成為應(yīng)用普及的關(guān)鍵角色。

    xAI 雖未公布 Grok 4 Fast 的具體參數(shù),但根據(jù)命名邏輯的行業(yè)慣例,其大概率是在 Grok 4 的基礎(chǔ)上通過蒸餾、架構(gòu)優(yōu)化等技術(shù)降低了計(jì)算負(fù)載與延遲。這意味著它能在更低配置的服務(wù)器甚至邊緣設(shè)備上高效運(yùn)行,并實(shí)現(xiàn)遠(yuǎn)低于 Grok 4 Heavy 每百萬 tokens 輸入 3 美元、輸出 15 美元的“奢侈品”定價(jià)。

    “低成本推理”主打的不是推理,而是低成本。在智能上限短期內(nèi)突破無望的背景下,每省下一個(gè) token,每個(gè) token 多便宜一點(diǎn),都是向落地多邁出了一步。而在這場(chǎng)性價(jià)比搏擊中,馬斯克先揮出了一記重拳。

    參考資料:

    https://x.ai/news/grok-4-fast#native-tool-use-with-sota-search

    雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))文章


    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    分享:
    相關(guān)文章
    最新文章
    請(qǐng)?zhí)顚懮暾?qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說