0
在資本、話題堆疊之下,大模型的狂熱已經席卷國內大半年,恍惚間我們已經進入了全民大模型時代。
但其實在8月31日之前,各家AI大模型產品尚處于試用階段,還并未獲得正式面向公眾提供服務的資格。前期預熱到頂,一直到8月31日一則重磅消息砸下,包括了百度的“文心一言”、中科院的“紫東太初大模型”在內的,國內首批8家企業/機構的AI大模型產品通過了《生成式人工智能服務管理暫行辦法》的備案,代表著他們已經正式獲得了面向公眾提供服務的資格。
據七麥數據顯示,“文心一言”APP8月31日開放下載首日,在蘋果App Store應用商店下載量預估為31.3萬次左右,智譜清言App則為3832次,據百度官方公布的數據顯示,24小時內,文心一言共計回復網友超3342萬個問題。
AI 大模型全面“開閘”是國內大模型發展的一次關鍵時刻,使得上述8家大模型產品擁有了先發優勢。
國內大模型武力值大比拼正式開始,之前,國內類ChatGPT的大模型產品都無一例外側重“對話交互型”,各家對大模型實力的比拼,簡單地集中在回答問題的精確度、榜單排名這些可量化的維度上,大多數C端用戶與AI的對話內容都趨向于閑聊,而沒有創造。另一方面,C 端用戶的付費意愿低,To C 的通用大模型產品短期內無法復制 ChatGPT 的成功模式,在同質化產品的圍攻下被迫加入資源競賽的燒錢游戲?;剡^頭看,To B 客戶付費意愿高,需求大,隨著市場回歸理性,大模型選擇 To B 幾乎成為行業內心照不宣的一個范式。
所以未來,大模型競爭的真正賽場主要集中于服務B端用戶。眼下,大廠和創業公司們正在將眼光重新聚焦于產業。
在浮華之下,我們開始去挖掘哪些大模型廠商在思考大模型的真正價值——在ChatGPT帶來的AI智能振奮之外,大模型到底能給產業帶來什么?以及AI大模型時代,產業需要的是什么?他們的大模型能力要如何與產業結合?我們也在警惕,這是否又是一次各大廠商之間花拳繡腿的AI技術武力值比拼。
只有當潮水退去的時候,我們才會知道誰在裸泳。
有媒體報道稱截至今年7月,中國累計已經有130個大模型問世,數量超過美國進入大模型第一梯隊。大模型更是被稱為新一代基礎設施,但到產業側,很多企業并沒有真正把大模型用起來。而沒有用起來的原因主要還是政策沒有開放,但是產業端的熱情是非常高的,比C端更甚。
一家主打“消費內容+營銷服務”公司的CEO王峰告訴雷峰網,現在業界有一個說法,未來互聯網上90%的內容都是由AI生成的,這意味著大模型對他們業務的挑戰和沖擊是非常大的,所以他們必須早做應對。
為了應對此次沖擊,他們今年年初從原來的各Team中抽調出一部分人,成立了AI Lab團隊,做大模型方面的探索和嘗試。
在王峰看來,通用大模型的學習和適應能力還是很強的,大家都看到了它如何驚艷,但也存在一定的局限,例如我們和GPT或國內模型對話時,問它怎么挑選茶葉的問題,它只會泛泛的告訴你要注意什么?很多時候,輸出的內容并沒能直接幫助消費者去做決策。
所以在王峰看來,大模型不是萬能的,局限之一就是不能解決垂類問題,這是當前很多產業側企業沒能用起來大模型能力的原因之一。
但從0開始基礎大模型的預訓練,資金投入需要非常大,對于他們這樣的企業來說不現實,而且對于很多企業來說即便有資金也能難做到,數據,算力,know-how,維護等等都是一道道門檻,所以只能尋求向市面上現有的大模型廠商合作。
國內模型能力的賣方可分為兩類:一類是BAT等大廠和大模型初創公司為主;此外還有大模型的中間商,主要是基于大模型開發應用型服務的創始團隊,包括底層算力與框架的提供者,甚至還包括提供大模型微調的第三方公司。
經過一番調研后,他決定訓練自己的模型:在別的大模型上,把自己所服務行業的專業知識灌進去做進一步訓練與微調,訓練完后在本地進行私有部署,再來解決對應垂類問題。
但是在這個過程中,他們又發現不知道該用哪一家的模型:目前國內已發布的大模型數量太多,如果他們要將所有的模型都驗證一遍、一一對比模型的效果,那么所消耗的人力成本會非常大。
事實上,B 端企業客戶往往自帶場景與數據,是大模型落地的最佳檢驗場。但當理論落地現實,王峰的困境也是許多B端企業所面臨的共同難題。
所以,基于上述原因,導致目前國內的大模型與行業之間猶如隔著一道高墻,墻的一邊大模型能力無法釋放,另一邊的數字化需求無法得到滿足。而且基于開放數據集訓練的大模型不擅長專業知識,掌握行業數據的企業用戶無法參與大模型的建設。
為了最大程度拆掉這堵墻,釋放大模型能力到產業側,讓掌握行業數據的企業用戶真正參與到大模型建設中來,百度智能云提出了自己的解決思路:千帆大模型平臺+解決方案+AI原生應用。
基于此,為了幫助企業和開發者快速基于基礎大模型再訓練,搭建企業專屬大模型,百度智能云推出了百度智能云千帆大模型平臺,在千帆平臺上,用戶可以直接調用包括文心一言在內的42個大模型服務,也可以在千帆上開發、部署和調用自己的行業大模型。
千帆大模型平臺為企業提供了大模型開發全流程工具鏈和整套環境,用戶可以完成從大模型開發、訓練、部署、應用開發的各個環節,經過升級后的千帆2.0整套的工具鏈覆蓋了大模型研發的全生命周期,包括:數據管理、模型訓練、評估&優化、預測服務和Prompt工程,端到端地幫助企業高效地開發和部署大模型應用,不斷降低大模型技術門檻。
百度智能云前期在進行市場調研時,發現很多企業客戶,對基礎大模型的選型策略上越來越專業、越來越理智。
原來他們了解一家大模型廠商的基礎大模型實力時,就是通過看榜單排名,現在他們選擇一家大模型時,要結合自身場景和數據去調優,會考慮很多,例如模型的效果、開發的效率、使用成本。所謂使用成本,例如資源占用,這個模型多大,需要占多少資源;性能怎么樣;針對企業任務去做調優,調優成本怎么樣,這些都是企業在選擇基礎模型時候考慮的因素。
發展到今天,產業上大家開始認真去考慮大模型作為基礎設施,怎么給自己帶來價值,而不是像早期僅僅只是湊熱鬧。
基于上述B端用戶對大模型的認知情況,千帆平臺為了滿足不同用戶的訴求,還接入了國內外42個主流大模型,方便用戶根據自身業務細分場景進行選擇。
上述能清晰認知自身大模型應用場景,并進行不同程度大模型開發的企業多集中于互聯網行業,他們對技術、行業認知通常排在前列,所以只要給他們提供好的完善的工具鏈和整套環境就能在千帆平臺上“自助”滿足自己的大模型需求。但在一些傳統行業,他們場景復雜,對大模型技術認知不夠,還必須大模型廠商深入行業,陪著企業一起梳理大模型應用場景,將大模型能力用起來。
所以百度智能云在數字政府、金融、工業、交通四大行業專門基于大模型能力重構了解決方案。
1、百度智能云數字政府解決方案「九州」,針對政務大模型做了全面增強,包括知識增強、檢索增強、認知迭代和安全策略增強。
2、百度智能云金融解決方案「開元」,基于開元重構的零售分析助手,能夠助理財經理實時掌握客戶動態,提供精準的業務洞察分析,基于業務目標智能推薦關鍵任務,并通過大模型生成千人千面的營銷話術。
3、百度智能云工業解決方案「開物」基于文心大模型升級,新開物將實現從“產線智能 ” 到 “企業智能” 再到 “產業鏈智能” 的跨越與提升。
4、智能交通解決方案 ACE3.0 。基于大模型重新設計和優化后,交通組織方案獲得更好的“診療效果”,覆蓋范圍更廣。例如,過去,交警部門對拋灑物的檢測很難做到精準識別,而大模型讓這類事件的識別準確率有了很大提升。
上述四大解決方案,更多是百度智能云為了給客戶和生態合作伙伴“打樣”,因為千帆大模型平臺期待未來能生態繁榮,越來越多用戶聚集到該平臺上來,既離不開客戶,也離不開生態合作伙伴的共建,期待能長出更多豐富的解方案和產品。
除了四大?業垂直解決?案,百度智能云也看到?量客戶的應?場景和業務需求是有共通之處的,他們把這些共性的需求歸納整理出來,正式推出適?于跨?業通?場景的AI原?應?Family,包括數字人 百度智能云曦靈、企業搜索引擎 臻知、安全生產智能助手 度安安等等。這些應?覆蓋了“服務營銷、辦公提效、?產優化”三個重點場景,一次發布了11個AI原生應用產品,滿足不同行業的通用需求,加速大模型的規模落地。
他們也都是一個個“樣板間”,意味著未來企業用戶也有機會在千帆平臺上開發出這樣的AI原生應用。但同時不僅僅是樣板間,因為也是滿足行業通用場景需求的產品。
百度智能云發布自己的千帆大模型平臺、行業解決方案、AI原生應用Family,從工具平臺到產品,合作伙伴,全方位推動大模型應用,加速大模型的應用落地。
在此番大模型競爭中走平臺模式打To B,不只百度智能云,同時,大家看到這種平臺模式都自然會產生一個疑問,跟hugging face有什么不同?
近日百度集團執行副總裁、百度智能云事業群總裁沈抖在媒體采訪中,也聊到了這個問題,他認為千帆不只是解決你來選模型的問題,更解決你把模型真正用起來的問題。用起來又包括數據、訓練、調優、Prompt 工程,以及應用搭建等一系列問題,還要充分考慮到成本和效率。千帆提供的是一站式服務,這是千帆跟 Hugging Face 的區別。
他還提到,Hugging face 模型廣度足夠,而千帆依托云廠商天然的優勢,有足夠大的運營空間,也可以做到端到端的訓練和推理性能優化。例如,訓練過程中的加速,故障的快速感知、定位、恢復;推理過程中基于百度龐大的異構計算集群的擴展性,有非常好的資源彈性,也可以提供 serverless 的服務,使得客戶獲得低基礎設施成本、無需運維、高擴展性的收益。這是千帆要比 Hugging Face 做得更深的地方。
今年3月百度智能云千帆?模型平臺發布上線。據百度智能云官方消息,今天千帆的?活企業數已經超過10000家,覆蓋了 制造、能源、政務、交通這些?業超過400個場景。真正讓很多企業感受到大模型的“智能力量”。
最直接的一個提效是,以前客戶想要看?個?模型的效果,光是接?調試、驗證評估等就需要算法團隊投??周的時間。現在在千帆?站式的?具鏈平臺上,客戶當天就可以跑通?個模型并且看到效果,快速進??模型應?開發階。
在雷峰網看來,百度智能云做對了幾件事:
1)千帆平臺擁有國內最多大模型,模型推理成本可降低50%。平臺接入了Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等主流的42個大模型,用戶可以根據不同的業務場景,選擇?個或者多個?模型來?,實現“模型?由”。這是許多想要做大模型平臺的廠商想要的效果,據雷峰網(公眾號:雷峰網)了解在一些大模型平臺上還只有幾家第三方大模型,剩下的全都是自家大模型。
這42家大模型都經過百度嚴格優選,不僅經過了模型效果、模型安全性、可商用三個維度的考核,還對所有接入的第三方模型均做了模型安全增強,不僅保障文心大模型的內容安全,還保障了第三方大模型的安全輸出。
但千帆又不只是簡單地把大模型毫無意義地集中到一起充當一個“便利店”,而是對每一個接入的大模型都做了二次性能增強,包括:a、中文增強。針對國外主流大模型做了中文增強,像Llama2這樣的國外大模型,原來要用英文對話效果才好,現在用中文也一樣好。b、性能增強,可以全面提升訓練和推理性能。訓練LlaMA 2的總體吞吐可以提升25%,推理性能甚至可以提升2倍。c、對開源模型提供上下文增強,滿足包括知識增強、長期記憶增強、文檔知識問答在內的各種長上下文場景的推理需求。
2)千帆平臺預置了41個數據集和10個精選應用范式。百度智能云在服務客戶時,發現有大量客戶覺得做模型微調時接入、管理數據太麻煩了,他們希望千帆平臺上能提前預置一些好的數據集。鑒于這個需求,在千帆平臺全面升級2.0上,預置了41個高質量的、有行業特色的數據集,用戶只要點幾個按鈕就可以完成微調、提高模型效果。
選好模型后下一步就是應用開發,為了進一步提升大模型的應用開發效率,千帆平臺提供了像知識問答、客服對話這樣的10個精選應用范式。
IDC預測,2026年中國AI大模型市場規模將達到211億美元,人工智能將進入大規模落地應用關鍵期。
每個掌握大模型自研能力的公司都想做大模型時代的基礎設施運營商,幾個月下來,行業目前只能確定,如果大模型真的是AI時代的智能運營商,如水電網等社會基礎設施,無論現有的行業玩家再多,最終也只有少數幾家能成功。
目前,國內大模型廠商主要包括百度、阿里、華為、騰訊、商湯這些企業,也有智源研究院、中科院自動化所等研究機構,同時英偉達等芯片廠商也紛紛入局。
在雷峰網看來,此番大模型時代的基礎設施運營商的競爭中,百度的優勢很明顯。
首先是作為AI云廠商的機會。
對于很多做AI原生應用的企業來說,有一個很大的痛點就是推理成本很高。因為推理非常耗費資源,需要買很多機器,而且很難控制量,買多了浪費, 買少了推理能力跟不上用戶的量。而這對云廠商來說卻是一個很大的機會,因為云的特性就是彈性資源,云廠商可以通過規?;⒓夹g優化的方式為這部分做AI原生應用的企業提供彈性的推理資源。
對于云廠商的機會,下到基礎設施,上到AI應用。百度集團副總裁侯震宇在9.5號的云智大會上表示,?模型不同于以往的AI技術迭代 ,它驅動了底層IT基礎設施的重構,也帶來了上層應用開發模式的顛覆。
在千帆平臺上,用戶降低了對大模型的推理成本。只有降低了推理成本,才能使得大模型的應用規模化,讓更多的人用起來,從而得到更多的反饋。
這要得益于百度“云智一體”戰略:早在2020年,百度就率先提出的“云智一體”概念,以云計算為基礎,以 AI 為引擎, 賦能千行百業。
同時,百度另一個優勢在于百度對AI技術的積累和對AI場景的探索早于其他廠商。
早在2010年初,百度就開始探索人工智能,此后不斷加大AI領域研發投入。彼時,鮮少有人能夠預見AI未來的發展。但百度用千億級的研發投入,顯示出百度對技術的執念,也可以說百度在AI方向上賭對了。
其次,百度自身的業務底層就是由AI驅動,最新的AI技術百度通常能夠先于其他廠商在內部快速大規模落地,所在面對用戶時,百度的大模型能力天然具有說服力。到今天,搜索、網盤、數字人、如流等產品都通過生成式AI進行了重構。
百度的另一個優勢是深入產業、躬身入局。從3月千帆平臺發布以來,百度智能云的團隊一共接觸了400多個場景,每一個場景都投入了大量人力去支撐,了解客戶的場景、用什么方法、效果怎么樣、如何改進,拿到市場反饋后,基于這些反饋再快速地對千帆平臺上的工具鏈進行迭代,形成正循環,不斷優化平臺。
北京寶蘭德軟件董事長易存道表示,如何把大模型在垂直行業做好,是目前各個企業都要考慮的問題,多數企業無法像百度一樣有能力建設大模型。怎么能夠把百度的大模型能力和企業業務有效結合起來,創造更強的價值,是企業非常好的彎道超車機會。
時至今日,我們可以感受到大模型技術變化太快,對企業來說,跟上潮流的成本很高,所以千帆平臺通過幫助產業把底層平臺建好、提供趁手的工具,以此來幫助提高企業使用大模型的能力,加快大模型大規模落地。同時,通過在AI大模型的布局與落地,通過千帆大模型平臺與產業深度合作,釋放“智能生產力”,百度自身也能穿越發展的“大周期”。
雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。