文心一言發布：GPT-4的「搶跑」與中國版ChatGPT的「長跑」

本文作者：陳彩嫻

2023-03-16 16:36

導語：AI 基建的分水嶺，最終會體現在「云」上。

今天，OpenAI 正式官宣 GPT-4，其中值得關注的點有兩個：

第一點是，對比 ChatGPT，GPT-4 的智能水平有了進一步的提升。

AI 在特定領域超越人類專家，在模擬律師考試中，ChatGPT 排名末尾 10%，但 GPT-4 在短短時間內卻進步到 Top 10%?，F場演講中，OpenAI 甚至展示了 GPT-4 處理稅收問題的能力，假設 Alice 與 Bob 結婚后，收入 XXX，問 2018 年標準扣稅額是是多少，GPT-4 能快速得到準確答案。

另一點是，OpenAI 在 GPT-4 的論文中強調了 AI 基礎設施的開發與優化。OpenAI 的官方博客闡明，GPT-4 是在微軟 Azure AI 超級計算機上訓練的。為了 GPT-4 能觸達全球用戶，Azure 云平臺的基建專門進行了 AI 方向的優化。

繼 ChatGPT 之后，GPT-4 的發布，讓 AI 與云的關系更進了一步。

AI 越火，以ChatGPT 為代表的大模型越火，云服務的任務就越急迫。GPT-4 的發布，短期內會加劇這一局面，從長期來看，AI 與云的配合、算力、算法、數據的協同，才是留給國內投身智能計算的廠商需要打磨的地方。

GPT-4 的推出，對于「中國的 ChatGPT」們（尤其是即將發布的「文心一言」）來說自然是搶跑；但如果將 AI 視為一場長跑，我們只要跑起來就有機會——在國外友商推出一項從 0 到 1 的技術后，把這項技術玩出「花」來，實現從 1 到 100 的跨越是國內廠商們的強項；而這一切的關鍵，則取決于我們的基礎技術建設，是否足夠消化這項技術。

而細究緣由，這是行業所趨，也是技術發展的客觀規律。

一、AI「三分天下」，云成為分水嶺

生物學上，靈長類動物大腦皮層的神經元數量與通用智能水平成正比；人類的神經元數量為 163 億個，約為大猩猩的 1.8 倍，恒河猴的 9.6 倍，前者在認知與理解世界的智能層面明顯高于高兩者。

一項研究（如下）也表明，當模型的規模達到一定程度后，大量的智能能力才具備「涌現」的基礎。基于以往的研究，AI 界對大模型的研究將繼續往規模拓展上努力。盡管越往后、邊際效益愈加遞減，但行業普遍的共識是：大模型的開發還遠遠沒有到頭。

換言之，以大模型驅動的 AI，會是接下來五年、甚至十年的 AI 主題。

文心一言發布：GPT-4的「搶跑」與中國版ChatGPT的「長跑」

圖源：谷歌論文「Emergent Abilities of Large Language Models」

基于這個前提，我們就不得不聚焦于大模型研究的高門檻：如果說深度學習的基石是數據、算法與算力三駕馬車，那么大模型則是大數據、精算法與大算力三駕航母，成本高、技術刁、工程難。能玩得起大模型的，必須是有人、有錢、有時間。因此，小企業與創業團隊基本無法「自研」，類 ChatGPT 的鑰匙只會握在資源雄厚的大廠手中。

GPT-3 剛出現時，大模型的這一特質還被行業詬病。但從去年 8 月 Stable Diffusion 、Midjourney 與百度「文心一格」等掀起的文生圖熱浪開始，由大廠帶頭推動 AI 生態建設的聲音開始出現。有行業人士開始改口，認為科技巨頭的入局有利于推動底層模型的進一步優化。同時，越來越多的創業團隊也放棄了「自研」大模型，轉而希望像 OpenAI 依傍微軟一樣，與國內的 AI 大廠（如百度、阿里、華為等等）建立合作。

在這種情況下，國內以語言大模型為中心的智能時代，在起步階段就出現了「三分天下」的局面：

首先是以百度、阿里等為代表的互聯網大廠，因為在深度學習的 AI 研究基礎上有雄厚積累，同時從2020年 GPT-3 出現后就開始加注大模型，有人才、又燒得起錢（如百度過去十年的研發投入是1000億），因此被 ChatGPT 的觀望者們視為國產大模型開發的領軍力量，以及大模型服務的「供應商」。

其次是希望站在開源大模型的肩膀上的行業團隊。這當中，又可以分為兩類團隊：一是懂大模型開發、但沒有足夠資源的 AI 公司，他們最終會像 OpenAI 一樣與大廠合作；二是不懂大模型開發、但懂行業痛點的非技術團隊，他們希望用 ChatGPT 相關的技術去解決行業問題，如售前售后、私人家教、論文翻譯與解讀等等。這一類，是大模型的「淘金者」。

最后是間接受益于大模型的 B/C 端用戶。ChatGPT 與其他的 AI 大模型（如決策、視覺、多模態）會為他們的生產與生活帶來智能提升。以百度「文心一格」等 AI 作畫產品為例，AI 小白用戶也能通過輸入簡單的一句話 Prompt（提示）「召喚」AI 快速畫出質量高的圖像，豐富了數字圖像內容創作的方法?？梢韵胂?，國內若推出類 ChatGPT （如百度即將發布的「文心一言」）產品也將為用戶獲取信息、優化工作流程等帶來極大的便利。而大模型在與行業結合、與個人用戶交流的過程中，又會獲取更多高質量的數據，變得更智能。

換言之，大模型驅動下，AI 時代的模型與算法會成為像核電、煤電、風電一樣的資源。發電廠不會把發電的能力賣給用電的人；用電的人也沒必要自己買一個發電機，因為發電廠供電又穩定又安全。而在這種情況下，只有「云+API」的方式才能形成強者愈強的馬太效應。

有行業人士就分析：

各巨頭公司應該會各自為戰，利用好自己的資源優勢，構建自己的服務能力，以 API 的方式賣給中小企業和政府做應用開發（像現在的云和以前的水電），同時自己的垂域產品也會做相應升級，確保對應的營收和用戶規模持續增長。

也就是說，在 ChatGPT 的淘金熱中，科技巨頭不僅是「淘金者」，還是「賣鏟人」。

當穩健安全可控、低成本高效率的 AI 模型服務成為巨頭們要占領的下一個商業摩天嶺，如何提升「云」的智能計算水平成為關鍵；其背后的基礎設施，如芯片、框架、算法及應用，直接關乎成本與效率，也成為兵家必爭之地。

二、AI 時代，云要「智能」

由于大模型的研究特征，計算的「智能」需求也是必然趨勢，類 ChatGPT 的商業角逐最終也落在了云的競爭上。

OpenAI 曾有一個很有意思的數據統計：2016 年，OpenAI 員工總數 52 人，平均年薪不到百萬人民幣，云計算一欄的支出是 232.9 萬美元左右；但到 2019 年，OpenAI 的員工整體薪酬仍遠低于市場價，云計算的支出卻已經增加到了 3100 萬美元，翻了 13 倍之多。

這說明，在 AI 的研究發展中，基礎設施比人貴，云計算的需求增速更快、商業空間無可限量。同時，在新的十年，誰能為 AI 支持算力，誰就能成為下一個領跑者。

在這一戰中，百度智能云是最早在云上布局 AI 能力、將 AI 與云捆綁售賣的云廠商之一。而由于十多年在 AI 領域的持續研發投入，在 ChatGPT 開啟的新 AI 時代中，AI 的底層能力似乎也開始反向助推百度在云計算服務上的優勢，扭轉國內現有的云布局。

2012年深度學習席卷時，百度是國內最早注意到這個風向的科技公司。當年，「深度學習之父」Geoffrey Hinton 開公司拍賣，有四家企業在競標中窮追猛打，其中一家、也是唯一的一家中國公司，就是百度（另外三家分別是谷歌、微軟與DeepMind）。

2013年，百度建立了中國第一個深度學習研究院（IDL）。作為國內最早進入深度學習領域的互聯網大廠，百度在 AI 上十年投入 1000 億，2016年開源出首個國產深度學習框架PaddlePaddle（飛槳），是國內至今唯一能與國際兩大主流框架 TensorFlow 和 PyTorch 正面交鋒的深度學習框架；大模型上，2021年發布百億參數中英雙語大模型 PLATO-X、千億參數大模型「百度·文心」，2022年又發布知識增強大模型 Ernie……

由于很早開始訓練深度學習模型，百度在計算資源的布局上也極早考慮到了 AI 的需求。

據了解，2012年，百度就在李彥宏的老家山西陽泉建了一個計算中心，2014年開始分批投入使用，2018年全部交付。百度陽泉計算中心擁有600多項自主研發技術專利，包含「冰山」冷存儲服務器和 X-MAN 超級 AI 計算平臺等自研計算系統，每秒可以完成 2000 萬億次深度神經網絡計算。

建成后，百度在陽泉的計算中心一直是只跑百度自己的業務，比如搜索、網盤、自動駕駛、生物計算等，在各種 AI 場景下均有磨練。2022 年 12 月底，百度正式將陽泉計算中心升級為「智算中心」后，開始對外提供 AI 的智算需求服務。據了解，目前百度智算中心在現有千卡并行環境下可以實現加速比90%，做到單機群萬卡規模，有效支持大規模訓練場景。

文心一言發布：GPT-4的「搶跑」與中國版ChatGPT的「長跑」

百度陽泉智算中心

目前國內多個智算中心里，阿里烏蘭察布智算中心的算力為 3 EFLOPS，商湯上海臨港計算中心的峰值算力為 3.74 EFLOPS，而百度陽泉智算中心的算力可達到 4 EFLOPS。

內部消息，百度即將發布的「文心一言」一部分也是在陽泉智算中心計算。陽泉智算中心專門搭建了一個機房去支持「文心一言」的運行，目前正在封閉壓力測試中，即將上線。此前，陽泉已支持文心大模型、文心一格等 AI 產品的計算需求。

目前，陽泉智算中心也是亞洲最大的單體智算中心。在多項自研制冷技術的加持下，百度陽泉智算中心的 PUE 值降到了 1.08，排名全國第一。更低的能耗意味著更低的成本，價格的優勢也最終體現在對外的云服務上。雷峰網

更值得一提的是，百度智能云在 2022 年推出了端到端的 AI 基礎設施——「AI 大底座」，可以提供 AI 模型開發的全棧服務。在百度的「AI 大底座」上，企業不用有很高的 AI 開發能力，也無需投入大量成本建設企業的 AI 基礎設施，只需把精力和成本放在自身業務場景的打磨上，AI開發的全流程都可以交給百度“AI大底座”來完成。

傳統來說，AI 算法的開發部署需要經過四大環節：數據處理、算法訓練、芯片適配計算與應用開發，其中，訓練算法的框架與芯片是壁壘環節。百度的「AI 大底座」在芯片環節布置了自研的昆侖芯、框架環節布置了飛槳，模型層則有文心大模型等，頂層應用還開發出 AI 數字人、AI 質檢等應用，打通了 AI 開發一整套流程，且每一環單獨拿出來都很扛打。

文心一言發布：GPT-4的「搶跑」與中國版ChatGPT的「長跑」

圖注：百度 AI 大底座架構圖

ChatGPT 出來后，大家的關注點集中在算力的數量與成本上，這一點毋庸置疑。但長期來看，大模型與 ChatGPT 最終必然會沉淀到行業中去解決實際問題。這時候，「模型即（商品）服務」的概念下，將 AI 模型包裝成易用可得的商品的能力就成為決勝關鍵。

而「AI 大底座」猶如方塊拼湊，設計的靈活度就恰到好處。

如果小模型時代，AI 的智能是一年級學生的水平，那么大模型時代，AI 的智能則相當于高中生。不同的智能水平，必然驅動不同的應用需求，未來的 AI 應用場景與 AI 開發流程也將很可能發生巨變。也就是說，ChatGPT、乃至 AGI 的應用開發面臨極大的不確定性。

百度在芯片、框架、算法與應用方面，均有 AI 能力，能應對產業的更多需求：

?面向有一定 AI 開發團隊的大企業，百度可以提供「AI 大底座」中的其中一環或多環能力，如飛槳+昆侖，或飛槳+文心，或昆侖+文心；

?面對 AI 基礎設施較差的傳統行業，百度的「AI 大底座」可以提供全流程、端到端的 AI 開發服務。加上百度有 EasyDL 的全自動開發實踐，此前基于大底座，百度智能云已經積累了 11 個行業大模型的訓練與計算經驗，可以幫助客戶定制場景服務。雷峰網(公眾號：雷峰網)

據了解，百度智能云的戰略是「云智一體，深入產業」，強調云與 AI 能力的結合，并深入產業的具體場景，用云與 AI 解決產業生產環節中的實際問題，幫助企業實現智能化轉型，而不是簡單提供存儲與計算能力。雷峰網

雷峰網觀察到，百度在 2021 年年底打磨出文心大模型后，就開始對產業輸出。百度的輸出模式是：首先服務行業大客戶，通過解決大客戶的棘手難題積累數據與經驗，沉淀到「AI 大底座」的模型層中；然后，將已經實踐過的行業大模型能力復制到行業內的其他客戶場景中，實現模型的泛化。

這套模式在大模型時代尤其具有商業可行性。

舉個例子，百度與國家電網合作巡檢項目，通過無人機搜集山頭電線桿的圖像后返回數據中臺進行處理與算法優化，新訓練的「電力大模型」算法識別準確率能提升 30%、效率提升 5 倍。在小模型時代，一個 AI 算法在東北三省也許適用，但遷移到南方就需要重新訓練；但在大模型時代，遷移到另一個地方時，只需要在當地采集少量數據進行低成本調優，「電力大模型」就可以直接上崗。

大模型打磨地越多，復制成本越低，后面的客戶就越用越好。在智能時代，云的定義發生了改變：以前云是資源，按需索??；現在，云需要搭載 AI 技術變成生產力，解決企業招聘部分崗位難、降低企業用人成本等，轉化為可見的效率。

細數國內云廠商的 AI 能力，隨著「云+AI」的模式逐漸占據主流，過往在 AI 研發上投入不足的云廠商正在智能計算的奔跑中退后。百度智能云起步晚、市場占有率低，但改變了戰斗方式，逐步體現出了 AI 時代的差異化競爭優勢，將自己打造成智算時代最接近用戶需求的一朵云。

ChatGPT 的風波，在云的市場，分流出了一條新的路：云智一體，勢不可擋。在這次 AI 時代的搶跑中，百度確實迎來了新的機遇。

三、「賣鏟人」也是「淘金者」

據了解，百度大模型為其內部產品的效果提升做出了肉眼可見的貢獻。

一個數據統計是，在百度文心大模型的加持下，百度搜索的問題分類準確率提升 4.5%，新聞去重召回率提升 8%，視頻推薦召回率提升 10%，小度的意圖理解準確率提升了3.1%。

百度既是「淘金者」，也是賣淘金工具的人。只有了解淘金的難點，才能賣好工具。

消息稱，百度發布文心一言后，將通過百度智能云對外提供服務，逐步將文心一言的能力落地到生產的實際場景中。未來，不管是 API 的調用，還是場景的定制，都是通過云去統一對外輸出。

從前，云廠商之間的競爭主要體現在比較誰能夠在最短的時間內響應客戶需求。算力越精準，客戶的成本越低。但人工智能時代來臨后，AI 會衍生出許多生態的問題，光比彈性已經意義不大。未來，客戶需要的也不再只是一張能訓練 AI 的GPU，而是一整套 AI 解決方案。

ChatGPT 打造了云的分水嶺，這一戰，百度能否勝出？

時間會告訴我們答案。

參考鏈接：

?https://arxiv.org/pdf/2206.07682.pdf

?https://openai.com/product/gpt-4

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

陳彩嫻

編輯

發私信

當月熱門文章