讓聽得見炮火的人來做 AI

本文作者：陳彩嫻

2023-02-09 15:28

導語：過去將算法束之高閣的時代已經結束，AI 的生產力必須解放給更多行業人士。

2022年10月，工信部公示《國家人工智能創新應用先導區“智賦百景”》，涉及AI落地的9大領域、100個場景、8個先導區。

這個舉動相當于官方泄題，把AI落地的重點科目和尖子生寫在了表格上。

AI科技評論觀察到，9大領域中，關于公共安全、交通運輸的場景最多，這些場景的AI滲透率已經比較高，旨在發力向縱深探索，屬于試卷中的必答題。而制造、農業、能源、金融、醫療作為我國的重要經濟支柱，雖然經濟貢獻和戰略地位極高，但尚屬AI落地的處女地，是新考試中的新題型。

或許可以從農業中看到端倪：一顆草莓從生長到采摘，需要多少種算法？

草莓的生長過程中有20多種侵染性病害，10多種生理性病害，40多種蟲害，要輔助人工準確識別它們，需要不同的AI算法。

在采摘中，確定草莓成熟度核心指標在于果面著色程度，一般分別在果面著色達70%、80%、90%時采收，但如果只有這個指標，機器很容易將草莓和同色系物品混淆，比如圣女果，所以往往還需要輔助紋理識別算法。在通過機器視覺識別成熟度前，需要先區分果與葉，對草莓進行定位并找出根莖部分，采摘后需要用托盤穩穩接住，這個過程對定位識別算法的要求很高。此外，壞果、爛果、小果、異形果也需要被區分。

這僅僅是一顆草莓的生命周期管理，就需要上百種AI算法。

而作為農業大國，僅新中國成立來孕育成功的新品種，就有3萬個。近些年，農林牧漁業產值不斷攀升，從2010年的67763.13億元，逐年增長至2021年的147013.4億元，近11年增量達79250.27億元、增幅達116.95%。

從看護一顆草莓，到支撐起如此龐大的智能農業產業，AI能發揮的價值難以想象，所需要的算法種類更是浩如星海。

難度加深，題型變廣，中國人工智能領域的官方定調已經明白無誤：上一個十年，人工智能走出實驗室扎根到少數幾個頭部產業，新十年要從頭部產業走向千行百業。

當市場呼喚更多AI能量的觀點進入官方文件時，新的故事就開始了。

1、在不確定性中尋找確定性

最先感受到水溫變化的，是離客戶最近的系統集成商。

“如今70%的集成項目中都有AI，是機遇也是挑戰。”

劉先生所在的公司主做無人機巡檢領域的系統集成，維護了大量優質的政府、園區客戶，也同步對接算法公司、軟件公司、硬件公司、工程團隊等。

在智慧巡檢的建設方案中，傳統上靠人工肉眼查看，AI的價值多體現為車輛識別、人員聚集識別等。但今年，劉先生公司接到了更多新需求，最高頻的是井蓋丟失識別、游攤小販識別，河道垃圾識別、火焰煙霧識別等；甚至很多算法需求，在市場上幾乎找不到供應商，比如農田遙感、電網安全、河網監控等。

這些需求讓劉先生很興奮。人無我有，人有我優。傳統的智慧巡檢領域競爭激烈，如果能拿下新場景，不僅有利于單個項目的控標，還能搶占一塊新高地。

行業數據佐證了劉先生的感知。根據IDC最新發布的《中國加速計算市場（2021年下半年）跟蹤報告》，2021年全年，中國AI服務器市場規模達350.3億元，同比增長68.6%——如果把算法比作是菜譜，那算力和數據則分別是廚具和食材，廚具消耗量的增加，必然與菜品的增加同步——AI市場的需求總量在快速井噴。

讓聽得見炮火的人來做 AI

更重要的是，IDC報告還顯示，AI算力市場規模前6大行業中，金融、服務、制造和能源等新進領域均表現出高達80%的漲幅。也就是說，不僅需求總量增加了，AI算法的多樣性也增加了。

這種增加是市場自發行為。比如上?！耙痪W統管”，在疫情發生后，開始使用人工智能來監測車輛違章停放、共享單車跌倒、垃圾拋灑等問題，從原先被動需要人力維護，變成主動進行智慧管理。又比如，人工智能在診療領域過去大量應用于人工智能讀片，看肺部結節的效率要比人眼讀片高很多，而今，人工智能讀片則覆蓋到了骨科、心腦血管、婦科等全新領域。

市場對人工智能的想象早已跳出了“人、車、非”老三樣，能不能盡快占領新需求的高地，也成為集成商們能坐哪把江湖交椅的重要依據。

對于大集成商而言，一個項目中落地上百個AI算法是常有的事，這意味著巨大的潛在增值空間，也意味著不可控的交付風險。

以工業機器人領域為例，2014年系統集成商企業數量不到500家，到2021年數量已經超過3500家。但從財務上看，營收小于1個億仍然是大部分集成商的命運，能做到5個億已經是行業佼佼者。從單個項目上看，遇到好項目毛利率能到20%-30%，但大部分情況下，毛利潤則低于20%，如果是陌生的全新場景，那么賠本也有可能。

劉先生想帶領團隊探索AI的未知之境。但是，把AI寫進PPT很容易，落到項目里很難。

于是，冰火兩重天成了AI行業的現狀：一面，是肉眼可見的行業蛋糕變大了；但另一面，是從業者如履薄冰，聞定制而色變。

2、夢想照進現實

究其本質，AI算法無法成為標品。

一條流水線可以生產千萬瓶農夫山泉，賣給無數消費者；但算法和場景的關系，卻約等于《阿凡達》中納美人和迅雷翼獸的關系，每一個算法都需要與具體的場景精準適配。

這項工作非常復雜。從數據環開始，算法工程師就需要分析場景的圖像數據特點，依次設計對應的算法方案，并根據算法落地的硬件芯片大小設計模型結構，通過超參調節與訓練得到一個 AI 模型，然后部署到攝像頭、無人機等終端產品上。

而且，這不是一個走一遍就能完成的流程。深度學習是一個「黑盒子」，算法精度的提升可能取決于數據特點，也可能取決于模型參數規模與架構。由于視覺算法天生要與終邊端結合，最終的算法調整還與終邊端硬件的算力（即芯片）大小有關。牽一發而動全身，所以，算法工程師往往要來來回回走完整條流程，才能得到一個不錯的 AI 算法。

計算下來，開發一個 AI 算法大概需要3個月，算法與硬件的適配調優又要耗時 3 個月左右，所以單個 AI 算法的平均交付時間大概 6 個月。AI 算法工程師的人力成本平均在年薪 50 萬以上，一個算法項目的研發需要 5 到 10 人，加上圖像數據的標注成本等，就構成了 AI 算法的尷尬局面：

「海量需求，精細定制，人力太貴，做不過來」。

讓聽得見炮火的人來做 AI

圖注：人工智能各職能崗位人才供需比

數據來源：工信部人工智能產業人才發展報告（2019-2020年版）報告編寫組調研數據庫、BOSS直聘

AI是無處不在的需求，也是不敢輕易接手的山芋。作為產業鏈的中間環節，集成商向上對接核心技術提供商，比如算法廠商、芯片廠商，向下對接終端客戶和工程實施方。如果要探索新的算法應用，自然離不開產業鏈的上下游。

如果我們把視角放得宏觀一些，會發現當下的AI產業鏈已經在慢慢走向成熟了。

最典型的體現是連接數。據 IoTAnalysis 研究數據， 2020年全球AIoT連接數達到117億，首次超過非物聯網連接數——這個數據在2010年是8億次，增長近15倍，而每一次連接，背后都有數次AI運算。

15倍速的增長，背后依靠的是數據和算力的循環增強，這些產業基礎設施的完善讓AI的夢想有了照進現實的條件。

以數據處理為例。吳恩達在“二八定律”中對數據之于AI的重要性有非常直觀的描述：80%的數據+20%的模型=更好的AI。

充足的數據是算法模型成功的前提，但數據處理環節極為龐雜，即使是最成熟的人臉識別，訓練一個模型也大概需要千萬的樣本量，整個數據處理工作則要占項目總成本的近60%，占項目開發周期的80%。

如今，隨著產業分工的加速和技術的提升，專業數據處理機構和AI算法輔助標注平臺，可以通過預識別模型的方式，先將數據處理一遍，盡可能識別物體，再交由標注員操作，就可以將效率提升近一倍。

除了處理效率外，數據處理質量也在提升。在傳統數據處理過程中，主要通過人工抽查的方式對數據標注質量進行查漏補缺，但通過AI輔助質檢，不僅可以變“抽查”為“遍查”，還可以將平均數據準確率提升5%以上。

除了數據之外，走向成熟和標準化的還有算力產業。

根據方舟評估委員會的研究，雖然過去十年，人工智能計算的復雜度每年飆升10倍（每秒千萬億次運算），但與此同時成本卻每年下降10倍。比如， 2017年在公共云上訓練像 ResNet-50這樣的圖像分類器，成本約為1000美元，到了2019年只需大約10美元。

究其原因，一方面是AI架構的升級，另一方面則是專用芯片的出現及其性能的提升，比如 Nvidia于2017年發布的 V100顯卡，比三年前發布的 K80 快1800% ，還有一方面則是智能算力建設取得的成就。

據工信部數據，截至2021年底，全國在用智算中心超過20個；算力產業規模近五年平均增速超過30%，排名全球第二。預計到2023年，智能算力在總算力中的比重將超過70%，發揮核心拉動作用。

風云萬變一瞬息，在短短幾年間，智能算力從新生事物成為新基礎設施。這讓AI訓練和落地更有底氣了。

最直觀的表現是，2012年前罕見使用GPU進行計算，2015年以后，大規模使用上百個GPU進行訓練成為常事。而作為AI落地最常見的載體，智能攝像頭的價格單位也早已從萬元降至千元甚至百元。

市場需求催生專業分工，專業分工促進技術升級，技術升級導致性能迭代，性能迭代孕育成本降低，成本降低成就廣袤的市場需求。

數據端和算力端大致走完了這樣的閉環，這在行業層面讓算法研發的類型更多元、周期更短、成本更低。但這依舊不足以實現“智賦百景”背后的期望，整個產業對算法生產能力的期待呼之欲出。

3、AI 落地的新支點

如果說，變人力為機器，變復雜為標準，是數據和算力一日千里的秘訣。那么，算法有沒有可能標準化？

2012 年，加拿大不列顛哥倫比亞大學的 Frank Hutter 教授等人提出自動選擇模型與優化參數的 Auto-WEKA，是第一個 AutoML 點工具。之后，除了調參，也有針對網絡結構、函數選擇自動化的 AutoML 陸陸續續出現。

AutoML，即自動機器學習，是一種用AI訓練AI的工具。

但單點上的突破，并不能真正改變產業模式。AI 算法的生產特性決定了，但凡還有一個環節需要算法工程師操作，包括算法在終邊端的部署，就又回到了 AI 落地難的原點：離開算法工程師，算法開發就轉不動了。

基于此，更多算法公司將AutoML當做專業算法工程師的提效工具。但只要AI的生產和應用還掌握在少數專業算法工程師手里，AI就像是一種奢侈品；其背后的巨大需求潛力，也就沒法釋放出來。

如果想讓整個AI產業鏈的齒輪咬合緊密銜接絲滑，必須實現端到端的算法全鏈條自動化——這是新十年AI創業者的重要方向，「共達地」就是其中之一。

和單點自動化的AutoML不同，共達地要做的是AI算法生產全鏈路自動化的AutoML，是要將深度學習視覺算法開發的鏈條細細拆分，分成 13 個環節，從「數據分析」開始，一直到芯片適配，在算法開發的每個環節都設計不同的算法來代替 AI 工程師的工作。最終實現的效果是，數據上傳后就能自動訓練模型，訓練好的模型可以像安裝 APP 一樣下載。

讓聽得見炮火的人來做 AI

這個過程相當于把數據、算法與算力進行了拆分，分別自動化，每一個模塊都用 AutoML 的算法來實現。例如，數據分析一環，AutoML 可以自動分析上傳數據中的場景豐富度、物體類別、目標尺寸、有無遮擋、光照強弱等等。在芯片適配，用戶自主選擇模型想要適配的芯片，平臺同樣會通過算法來自動匹配和計算。

用戶只需做兩件事：一是定義好需求，二是數據迭代。而這兩個環節可以由離業務場景最近的人來完成，如上述所說的產線工人、物業經理等等。

讓聽得見炮火的人來做 AI

圖注：共達地自動化訓練開發平臺流程

原本訓練算法是個「黑盒子」，但這個過程被流水線化了。反復調參的前提不存在了，成本和周期自然也就消失了。想要什么樣的算法，就喂什么樣的數據。

這種能力對集成商來說，很有吸引力。

自建 AI 團隊的成本太高，但產品經理與項目經理的人數永遠是最多的。所以，如果他們僅僅需要上傳數據，就能像安裝 APP 一樣得到解決自己問題的 AI 算法，那么 AI 的足跡就會迅速布滿全國各地，真正促進數字化的轉型。

不過，算法生產出的算法，精度能否與人類生產的算法相媲美；

沒有專業算法團隊的集成商，是否能熟練使用這項能力；

這兩大前提，是驗證 AutoML 平臺是否行得通的試金石。

創立第二年，共達地得到了肯定的答案。一家視覺算法公司想用 AI 識別火焰煙霧。此前，該公司內部的算法團隊花了半年左右的時間才做出一個算法。接觸到共達地后，在試用他們的算法自動化生產平臺時，他們將同一套數據上傳到該平臺，結果只用了 10 個小時就訓練出一個模型，而且算法的精度更勝一籌。

這種震撼是難以名狀的：回顧深度學習的歷史，深度學習第一次引起人們的震撼，就是 2011 年 Hinton 與鄧力在微軟語音識別中應用深度神經網絡，只用了幾天時間就完成了整個團隊花半年才做完的事情。而現在，AutoML 生產的算法也能實實在在地匹配人類工程師的工作——算法環節，終于也和數據、算力一樣，走上了工業化道路。

4、生產力解放想象力

只有解決長尾匹配，才能完成技術的價值閉環。而在實際業務中，越來越多碎片化的場景證實了 AutoML 平臺算法生產的意義。

今年年中，劉先生接到一個來自某地政府的智慧城市項目，需要用無人機+AI巡檢的方式，對轄區內的車輛、人員、河道、商販等進行管理，是劉先生從業以來遇到的覆蓋面積最大、算法類型最復雜的項目。

項目試點初期，以河道漂浮物識別為切入點，對比多家供應商的技術實力。劉先生在某專業算法大廠的算法商城中購買了河道漂浮物識別算法，但測試時92%的精度，到應用到業務場景后竟然低于10%。主要原因在于：一是實際河網環境復雜，二是河面反光造成了極大的影響。

后來，劉先生在共達地的 AutoML 平臺上通過采集到的視頻流自主動手訓練了河道漂浮物識別算法，應用到業務場景后，同樣由于遠距離、夜間識別的問題，精度只達到70%左右，但通過不斷巡檢，前端回傳現場數據進行迭代，5 天迭代 3 個版本后，精度達到了95%。

速度帶來質變。如果是之前靠人力迭代，相當于每次都要重新定制算法、重新走一遍上述十幾個環節的流程，耗時往往以月計，成本也高。但 AutoML 平臺自動生產、無需人力，機器 24 小時云運轉，以天為單位迭代，效率更高，得到高精度的時間也更短，對實際落地帶來了巨變。

AI 的生產力，解放了行業人士對「AI 能做什么」的想象力。

「過去不敢接的項目需求，現在敢接了；過去要倒騰半年的項目，現在一個月就可以交付妥當了?！惯@是劉先生最直觀的感受。雷峰網

這就好比汽車的發展：汽車最開始出現時，只有少數的富貴人家能擁有汽車，會開車的司機也很少；隨著生產力的發展，越來越多中產階級也能買上汽車；到乘車共享平臺誕生時，普通老百姓即使沒有汽車，也已經能通過平臺享受到汽車出行的服務。

通過 AutoML 平臺，AI不再是昂貴的產品，而是觸手可及的服務。傳統企業也能實現這樣的夢想：沒有 AI 團隊，也能交付靠譜的 AI 產品。

但更具想象力的是，工具升級以后，產業鏈也有了重塑的可能性。

在AI產業鏈中，繞不開的無非“算法，算力，數據“三大要素。而項目落地，則又包括需求分析、系統集成、API對接聯調、部署運維等細碎工作。

傳統AI公司自己下場做總包項目，左手采數據，右手建算力，又用昂貴的人力和組織成本，去做系統集成商的工作。雷峰網(公眾號：雷峰網)

于是，邊際效應誠實的反應在財務報表上，攤子鋪的越大，企業虧錢越多。

而共達地AutoML平臺率先將算法生產能力抽離出來，變成標準化服務，同時打通數據廠商和芯片適配。讓整個產業鏈回歸合理分工，各家廠商專注自己擅長的事情。

標準化，是效率的開端，更是協作的開始。

到2021 年，共達地的 AutoML 平臺已經打通了多家數據廠商，用戶可以無縫實現數據的標注服務。同時，平臺適配了超過 100款常見 AI 芯片，涵蓋英偉達、英特爾、高通、寒武紀等主流廠商。

這個過程可以參考信息產業。當信息產業從一家獨攬咨詢、操作系統、CPU、硬盤、整機等所有環節，發展為每個環節都有大量玩家和獨角獸時，信息產業生態便建立起來了。信息產業從煙囪林立，到樹狀相連，IT也在此刻成為各行各業的「基礎設施」。也正是在這個基礎上，中國經濟大體上完成信息化，邁向數字化。雷峰網

相應的，人工智能正在經歷的這個階段，或許可以稱為「AI生態元年」。

共達地的AutoML平臺，作為撬動AI生態的一個工具，只是革命的開始。隨著越來越多人參與到這個賽道中，帶來新的分工、新的標準、新的理解，共建人工智能的新生態。

在那里，才是AI真正的星辰大海。

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

陳彩嫻

編輯

發私信

當月熱門文章