0
| 本文作者: 郭瑞嬋 | 2023-02-22 18:29 |
“見了一年的投資人和客戶,大家上來就問,你們做不做預標注?能不能用預標注解決所有問題?”
在類GhatGPT大模型爆火的當下,預標注技術似乎已成為自動駕駛數據標注賽道上的致勝金牌,一家年輕的自動駕駛數據服務公司——愷望數據在近日舉辦的閉門交流會上給大熱的預標注技術“澆冷水”。
愷望數據產品項目VP張鵬表示,目前自動駕駛預標注技術僅能處理60%~70%的數據,仍需人工對算法預處理數據進行矯正,距離實現90%的全自動化目標仍有一段距離,需要分階段進行。
為此,愷望數據建立了一套過渡方案。愷望數據在會上透露,目前基于“自動化產線+規模化人力”為核心的愷望自動化數據產線已正式啟用。
一般而言,自動駕駛數據生產的流程包括需求規則的解讀、數據任務拆分、人員匹配,也包括在生產管理過程進行產能監管、質量監管、效率監管。
與著重關注“預標注”環節的技術方案不同,愷望自動化數據產線以數字驅動方式搭建了自動駕駛數據生產的全流程系統,通過SaaS平臺、算法、各板塊建模等工具,以及校企合作培訓逾千位“愷望人工智能訓練師”,對數據生產各個環節進行了優化。

該數據產線的突出特點是兼具自動化技術與人力運營管理兩大部分。
愷望數據CEO于旭表示,在數據生產的全流程中,目前有些部分已能夠實現全自動化,但有些部分,尤其是需要人為判斷的部分,還有待更多成熟的模型建成,才能逐步實現自動化。
另一方面,自動駕駛數據標注行業正在迎來指數級的數據增長需求,但融資環境遇冷,自動駕駛公司預算有限。于旭表示,數據標注行業也需降本增效,以滿足自動駕駛公司的低價需求。
為實現穩定的低價數據供應,在人力運營管理部分,愷望數據通過搭建“愷望數據學院”,與多家高職院校合作“愷望人工智能培訓師計劃”,對在校學生進行數據生產技能培訓與愷望自動化生產體系培訓,以獲得大規模的標準化人力。
在具體的運營管理上,愷望將借鑒Uber面向司機的培訓模式與管理經驗。按照計劃,愷望將在今年培訓超過1000位學生,第一批300人培訓目前已在山東等地高職院校完成。
據介紹,通過“自動化產線+規模化人力”的部署路徑,在提升數據生產規模化的同時,新產線運轉能夠減少成本超過20%。此外,新產線積累的人機交互數據和經驗也可以反哺給全自動化產線的建模,逐步推動數據生產從“成熟的人工模式”轉化為“成熟的人工智能模型”。
參考特斯拉的“影子模式”以及國內自動駕駛的產業鏈情況,愷望為公司定下了3年實現產線整體90%自動化的目標,而在某些具體項目上,1年內即可達成90%全自動化。
“特斯拉通過‘影子模式’,用接近2年的時間基本實現整體90%的自動化,但這是在百萬臺量產車、純視覺路線以及全產線自研的背景下才能做到。對比國內,量產車規模較小,且采用多傳感器的模式,產線分割嚴重,在這個現狀下,想單靠硬技術實現90%自動化還是有些難度。”于旭表示,這也是愷望決定另辟蹊徑同時從人力運營管理上下功夫的原因。
愷望數據成立于2022年2月,團隊成員來自字節跳動、阿里巴巴、Uber、Momenta、奔馳等公司。其中,作為公司創始人和CEO的于旭,擁有多段從零到一的大數據平臺搭建經驗,是字節跳動、Momenta、Uber等企業數據生產及運營體系搭建的第一人。

2022年9月6日,愷望數據宣布完成千萬級天使輪戰略融資,投資方包括辰韜資本、三一集團和溪山天使匯。目前,愷望數據已與三一集團在自動駕駛領域開展數據合作,其他客戶包括長安汽車、字節跳動、元戎啟行、輝羲智能、地平線、寒武紀、易控智駕、中科創達、中交興路、曠視、商湯等。
雷峰網(公眾號:雷峰網) 雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。