0
2022年10月,工信部公示《國家人工智能創新應用先導區“智賦百景”》,涉及AI落地的9大領域、100個場景、8個先導區。
這個舉動相當于官方泄題,把AI落地的重點科目和尖子生寫在了表格上。
AI科技評論觀察到,9大領域中,關于公共安全、交通運輸的場景最多,這些場景的AI滲透率已經比較高,旨在發力向縱深探索,屬于試卷中的必答題。而制造、農業、能源、金融、醫療作為我國的重要經濟支柱,雖然經濟貢獻和戰略地位極高,但尚屬AI落地的處女地,是新考試中的新題型。
或許可以從農業中看到端倪:一顆草莓從生長到采摘,需要多少種算法?
草莓的生長過程中有20多種侵染性病害,10多種生理性病害,40多種蟲害,要輔助人工準確識別它們,需要不同的AI算法。
在采摘中,確定草莓成熟度核心指標在于果面著色程度,一般分別在果面著色達70%、80%、90%時采收,但如果只有這個指標,機器很容易將草莓和同色系物品混淆,比如圣女果,所以往往還需要輔助紋理識別算法。在通過機器視覺識別成熟度前,需要先區分果與葉,對草莓進行定位并找出根莖部分,采摘后需要用托盤穩穩接住,這個過程對定位識別算法的要求很高。此外,壞果、爛果、小果、異形果也需要被區分。
這僅僅是一顆草莓的生命周期管理,就需要上百種AI算法。
而作為農業大國,僅新中國成立來孕育成功的新品種,就有3萬個。近些年,農林牧漁業產值不斷攀升,從2010年的67763.13億元,逐年增長至2021年的147013.4億元,近11年增量達79250.27億元、增幅達116.95%。
從看護一顆草莓,到支撐起如此龐大的智能農業產業,AI能發揮的價值難以想象,所需要的算法種類更是浩如星海。
難度加深,題型變廣,中國人工智能領域的官方定調已經明白無誤:上一個十年,人工智能走出實驗室扎根到少數幾個頭部產業,新十年要從頭部產業走向千行百業。
當市場呼喚更多AI能量的觀點進入官方文件時,新的故事就開始了。
1、在不確定性中尋找確定性
最先感受到水溫變化的,是離客戶最近的系統集成商。
“如今70%的集成項目中都有AI,是機遇也是挑戰。”
劉先生所在的公司主做無人機巡檢領域的系統集成,維護了大量優質的政府、園區客戶,也同步對接算法公司、軟件公司、硬件公司、工程團隊等。
在智慧巡檢的建設方案中,傳統上靠人工肉眼查看,AI的價值多體現為車輛識別、人員聚集識別等。但今年,劉先生公司接到了更多新需求,最高頻的是井蓋丟失識別、游攤小販識別,河道垃圾識別、火焰煙霧識別等;甚至很多算法需求,在市場上幾乎找不到供應商,比如農田遙感、電網安全、河網監控等。
這些需求讓劉先生很興奮。人無我有,人有我優。傳統的智慧巡檢領域競爭激烈,如果能拿下新場景,不僅有利于單個項目的控標,還能搶占一塊新高地。
行業數據佐證了劉先生的感知。根據IDC最新發布的《中國加速計算市場(2021年下半年)跟蹤報告》,2021年全年,中國AI服務器市場規模達350.3億元,同比增長68.6%——如果把算法比作是菜譜,那算力和數據則分別是廚具和食材,廚具消耗量的增加,必然與菜品的增加同步——AI市場的需求總量在快速井噴。

更重要的是,IDC報告還顯示,AI算力市場規模前6大行業中,金融、服務、制造和能源等新進領域均表現出高達80%的漲幅。也就是說,不僅需求總量增加了,AI算法的多樣性也增加了。
這種增加是市場自發行為。比如上?!耙痪W統管”,在疫情發生后,開始使用人工智能來監測車輛違章停放、共享單車跌倒、垃圾拋灑等問題,從原先被動需要人力維護,變成主動進行智慧管理。又比如,人工智能在診療領域過去大量應用于人工智能讀片,看肺部結節的效率要比人眼讀片高很多,而今,人工智能讀片則覆蓋到了骨科、心腦血管、婦科等全新領域。
市場對人工智能的想象早已跳出了“人、車、非”老三樣,能不能盡快占領新需求的高地,也成為集成商們能坐哪把江湖交椅的重要依據。
對于大集成商而言,一個項目中落地上百個AI算法是常有的事,這意味著巨大的潛在增值空間,也意味著不可控的交付風險。
以工業機器人領域為例,2014年系統集成商企業數量不到500家,到2021年數量已經超過3500家。但從財務上看,營收小于1個億仍然是大部分集成商的命運,能做到5個億已經是行業佼佼者。從單個項目上看,遇到好項目毛利率能到20%-30%,但大部分情況下,毛利潤則低于20%,如果是陌生的全新場景,那么賠本也有可能。
劉先生想帶領團隊探索AI的未知之境。但是,把AI寫進PPT很容易,落到項目里很難。
于是,冰火兩重天成了AI行業的現狀:一面,是肉眼可見的行業蛋糕變大了;但另一面,是從業者如履薄冰,聞定制而色變。
2、夢想照進現實
究其本質,AI算法無法成為標品。
一條流水線可以生產千萬瓶農夫山泉,賣給無數消費者;但算法和場景的關系,卻約等于《阿凡達》中納美人和迅雷翼獸的關系,每一個算法都需要與具體的場景精準適配。
這項工作非常復雜。從數據環開始,算法工程師就需要分析場景的圖像數據特點,依次設計對應的算法方案,并根據算法落地的硬件芯片大小設計模型結構,通過超參調節與訓練得到一個 AI 模型,然后部署到攝像頭、無人機等終端產品上。
而且,這不是一個走一遍就能完成的流程。深度學習是一個「黑盒子」,算法精度的提升可能取決于數據特點,也可能取決于模型參數規模與架構。由于視覺算法天生要與終邊端結合,最終的算法調整還與終邊端硬件的算力(即芯片)大小有關。牽一發而動全身,所以,算法工程師往往要來來回回走完整條流程,才能得到一個不錯的 AI 算法。
計算下來,開發一個 AI 算法大概需要3個月,算法與硬件的適配調優又要耗時 3 個月左右,所以單個 AI 算法的平均交付時間大概 6 個月。AI 算法工程師的人力成本平均在年薪 50 萬以上,一個算法項目的研發需要 5 到 10 人,加上圖像數據的標注成本等,就構成了 AI 算法的尷尬局面:
「海量需求,精細定制,人力太貴,做不過來」。

圖注:人工智能各職能崗位人才供需比
數據來源:工信部人工智能產業人才發展報告(2019-2020年版)報告編寫組調研數據庫、BOSS直聘
AI是無處不在的需求,也是不敢輕易接手的山芋。作為產業鏈的中間環節,集成商向上對接核心技術提供商,比如算法廠商、芯片廠商,向下對接終端客戶和工程實施方。如果要探索新的算法應用,自然離不開產業鏈的上下游。
如果我們把視角放得宏觀一些,會發現當下的AI產業鏈已經在慢慢走向成熟了。
最典型的體現是連接數。據 IoTAnalysis 研究數據, 2020年全球AIoT連接數達到117億, 首次超過非物聯網連接數——這個數據在2010年是8億次,增長近15倍,而每一次連接,背后都有數次AI運算。
15倍速的增長,背后依靠的是數據和算力的循環增強,這些產業基礎設施的完善讓AI的夢想有了照進現實的條件。
以數據處理為例。吳恩達在“二八定律”中對數據之于AI的重要性有非常直觀的描述:80%的數據+20%的模型=更好的AI。
充足的數據是算法模型成功的前提,但數據處理環節極為龐雜,即使是最成熟的人臉識別,訓練一個模型也大概需要千萬的樣本量,整個數據處理工作則要占項目總成本的近60%,占項目開發周期的80%。
如今,隨著產業分工的加速和技術的提升,專業數據處理機構和AI算法輔助標注平臺,可以通過預識別模型的方式,先將數據處理一遍,盡可能識別物體,再交由標注員操作,就可以將效率提升近一倍。
除了處理效率外,數據處理質量也在提升。在傳統數據處理過程中,主要通過人工抽查的方式對數據標注質量進行查漏補缺,但通過AI輔助質檢,不僅可以變“抽查”為“遍查”,還可以將平均數據準確率提升5%以上。
除了數據之外,走向成熟和標準化的還有算力產業。
根據方舟評估委員會的研究,雖然過去十年,人工智能計算的復雜度每年飆升10倍(每秒千萬億次運算),但與此同時成本卻每年下降10倍。比如, 2017年在公共云上訓練像 ResNet-50這樣的圖像分類器,成本約為1000美元,到了2019年只需大約10美元。
究其原因,一方面是AI架構的升級,另一方面則是專用芯片的出現及其性能的提升,比如 Nvidia于2017年發布的 V100顯卡,比三年前發布的 K80 快1800% ,還有一方面則是智能算力建設取得的成就。
據工信部數據,截至2021年底,全國在用智算中心超過20個;算力產業規模近五年平均增速超過30%,排名全球第二。預計到2023年,智能算力在總算力中的比重將超過70%,發揮核心拉動作用。
風云萬變一瞬息,在短短幾年間,智能算力從新生事物成為新基礎設施。這讓AI訓練和落地更有底氣了。
最直觀的表現是,2012年前罕見使用GPU進行計算,2015年以后,大規模使用上百個GPU進行訓練成為常事。而作為AI落地最常見的載體,智能攝像頭的價格單位也早已從萬元降至千元甚至百元。
市場需求催生專業分工,專業分工促進技術升級,技術升級導致性能迭代,性能迭代孕育成本降低,成本降低成就廣袤的市場需求。
數據端和算力端大致走完了這樣的閉環,這在行業層面讓算法研發的類型更多元、周期更短、成本更低。但這依舊不足以實現“智賦百景”背后的期望,整個產業對算法生產能力的期待呼之欲出。
3、AI 落地的新支點
如果說,變人力為機器,變復雜為標準,是數據和算力一日千里的秘訣。那么,算法有沒有可能標準化?
2012 年,加拿大不列顛哥倫比亞大學的 Frank Hutter 教授等人提出自動選擇模型與優化參數的 Auto-WEKA,是第一個 AutoML 點工具。之后,除了調參,也有針對網絡結構、函數選擇自動化的 AutoML 陸陸續續出現。
AutoML,即自動機器學習,是一種用AI訓練AI的工具。
但單點上的突破,并不能真正改變產業模式。AI 算法的生產特性決定了,但凡還有一個環節需要算法工程師操作,包括算法在終邊端的部署,就又回到了 AI 落地難的原點:離開算法工程師,算法開發就轉不動了。
基于此,更多算法公司將AutoML當做專業算法工程師的提效工具。但只要AI的生產和應用還掌握在少數專業算法工程師手里,AI就像是一種奢侈品;其背后的巨大需求潛力,也就沒法釋放出來。
如果想讓整個AI產業鏈的齒輪咬合緊密銜接絲滑,必須實現端到端的算法全鏈條自動化——這是新十年AI創業者的重要方向,「共達地」就是其中之一。
和單點自動化的AutoML不同,共達地要做的是AI算法生產全鏈路自動化的AutoML,是要將深度學習視覺算法開發的鏈條細細拆分,分成 13 個環節,從「數據分析」開始,一直到芯片適配,在算法開發的每個環節都設計不同的算法來代替 AI 工程師的工作。最終實現的效果是,數據上傳后就能自動訓練模型,訓練好的模型可以像安裝 APP 一樣下載。

這個過程相當于把數據、算法與算力進行了拆分,分別自動化,每一個模塊都用 AutoML 的算法來實現。例如,數據分析一環,AutoML 可以自動分析上傳數據中的場景豐富度、物體類別、目標尺寸、有無遮擋、光照強弱等等。在芯片適配,用戶自主選擇模型想要適配的芯片,平臺同樣會通過算法來自動匹配和計算。
用戶只需做兩件事:一是定義好需求,二是數據迭代。而這兩個環節可以由離業務場景最近的人來完成,如上述所說的產線工人、物業經理等等。

圖注:共達地自動化訓練開發平臺流程
原本訓練算法是個「黑盒子」,但這個過程被流水線化了。反復調參的前提不存在了,成本和周期自然也就消失了。想要什么樣的算法,就喂什么樣的數據。
這種能力對集成商來說,很有吸引力。
自建 AI 團隊的成本太高,但產品經理與項目經理的人數永遠是最多的。所以,如果他們僅僅需要上傳數據,就能像安裝 APP 一樣得到解決自己問題的 AI 算法,那么 AI 的足跡就會迅速布滿全國各地,真正促進數字化的轉型。
不過,算法生產出的算法,精度能否與人類生產的算法相媲美;
沒有專業算法團隊的集成商,是否能熟練使用這項能力;
這兩大前提,是驗證 AutoML 平臺是否行得通的試金石。
創立第二年,共達地得到了肯定的答案。一家視覺算法公司想用 AI 識別火焰煙霧。此前,該公司內部的算法團隊花了半年左右的時間才做出一個算法。接觸到共達地后,在試用他們的算法自動化生產平臺時,他們將同一套數據上傳到該平臺,結果只用了 10 個小時就訓練出一個模型,而且算法的精度更勝一籌。
這種震撼是難以名狀的:回顧深度學習的歷史,深度學習第一次引起人們的震撼,就是 2011 年 Hinton 與鄧力在微軟語音識別中應用深度神經網絡,只用了幾天時間就完成了整個團隊花半年才做完的事情。而現在,AutoML 生產的算法也能實實在在地匹配人類工程師的工作——算法環節,終于也和數據、算力一樣,走上了工業化道路。
4、生產力解放想象力
只有解決長尾匹配,才能完成技術的價值閉環。而在實際業務中,越來越多碎片化的場景證實了 AutoML 平臺算法生產的意義。
今年年中,劉先生接到一個來自某地政府的智慧城市項目,需要用無人機+AI巡檢的方式,對轄區內的車輛、人員、河道、商販等進行管理,是劉先生從業以來遇到的覆蓋面積最大、算法類型最復雜的項目。
項目試點初期,以河道漂浮物識別為切入點,對比多家供應商的技術實力。劉先生在某專業算法大廠的算法商城中購買了河道漂浮物識別算法,但測試時92%的精度,到應用到業務場景后竟然低于10%。主要原因在于:一是實際河網環境復雜,二是河面反光造成了極大的影響。
后來,劉先生在共達地的 AutoML 平臺上通過采集到的視頻流自主動手訓練了河道漂浮物識別算法,應用到業務場景后,同樣由于遠距離、夜間識別的問題,精度只達到70%左右,但通過不斷巡檢,前端回傳現場數據進行迭代,5 天迭代 3 個版本后,精度達到了95%。
速度帶來質變。如果是之前靠人力迭代,相當于每次都要重新定制算法、重新走一遍上述十幾個環節的流程,耗時往往以月計,成本也高。但 AutoML 平臺自動生產、無需人力,機器 24 小時云運轉,以天為單位迭代,效率更高,得到高精度的時間也更短,對實際落地帶來了巨變。
AI 的生產力,解放了行業人士對「AI 能做什么」的想象力。
「過去不敢接的項目需求,現在敢接了;過去要倒騰半年的項目,現在一個月就可以交付妥當了?!惯@是劉先生最直觀的感受。雷峰網
這就好比汽車的發展:汽車最開始出現時,只有少數的富貴人家能擁有汽車,會開車的司機也很少;隨著生產力的發展,越來越多中產階級也能買上汽車;到乘車共享平臺誕生時,普通老百姓即使沒有汽車,也已經能通過平臺享受到汽車出行的服務。
通過 AutoML 平臺,AI不再是昂貴的產品,而是觸手可及的服務。傳統企業也能實現這樣的夢想:沒有 AI 團隊,也能交付靠譜的 AI 產品。
但更具想象力的是,工具升級以后,產業鏈也有了重塑的可能性。
在AI產業鏈中,繞不開的無非“算法,算力,數據“三大要素。而項目落地,則又包括需求分析、系統集成、API對接聯調、部署運維等細碎工作。
傳統AI公司自己下場做總包項目,左手采數據,右手建算力,又用昂貴的人力和組織成本,去做系統集成商的工作。雷峰網(公眾號:雷峰網)
于是,邊際效應誠實的反應在財務報表上,攤子鋪的越大,企業虧錢越多。
而共達地AutoML平臺率先將算法生產能力抽離出來,變成標準化服務,同時打通數據廠商和芯片適配。讓整個產業鏈回歸合理分工,各家廠商專注自己擅長的事情。
標準化,是效率的開端,更是協作的開始。
到2021 年,共達地的 AutoML 平臺已經打通了多家數據廠商,用戶可以無縫實現數據的標注服務。同時,平臺適配了超過 100款常見 AI 芯片,涵蓋英偉達、英特爾、高通、寒武紀等主流廠商。
這個過程可以參考信息產業。當信息產業從一家獨攬咨詢、操作系統、CPU、硬盤、整機等所有環節,發展為每個環節都有大量玩家和獨角獸時,信息產業生態便建立起來了。信息產業從煙囪林立,到樹狀相連,IT也在此刻成為各行各業的「基礎設施」。也正是在這個基礎上,中國經濟大體上完成信息化,邁向數字化。雷峰網
相應的,人工智能正在經歷的這個階段,或許可以稱為「AI生態元年」。
共達地的AutoML平臺,作為撬動AI生態的一個工具,只是革命的開始。隨著越來越多人參與到這個賽道中,帶來新的分工、新的標準、新的理解,共建人工智能的新生態。
在那里,才是AI真正的星辰大海。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。