成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給郭思
    發送

    0

    港中文「1026實驗室」往事:賈佳亞與他的學生們

    本文作者: 郭思 2023-07-27 18:11
    導語:2004年,完全算不上人工智能發展史的大年,卻是計算機視覺先行者賈佳亞和他帶領的學生們開創的黃金時代的開端。



    港中文「1026實驗室」往事:賈佳亞與他的學生們

    屬于他們的黃金時代仍在繼續。

    作者 | 郭思 陳彩嫻

    編輯 | 岑峰

    那時他們覺得自己會永遠生猛下去,未來也還給了他們一個黃金時代。


    1、AI大潮來臨之前的先行者賈佳亞


    2004年,完全算不上人工智能發展史的大年,卻是計算機視覺先行者賈佳亞和他帶領的學生們開創的黃金時代的開端。他們起身、行走,以好奇心為導航,在人工智能的茫茫星野中進行無窮盡的探索。有時發現一些閃著光的寶貝,他們拾起,在行業中應用,然后繼續行走。行者無疆。

    故事開端是那年秋天,一個小伙子穿梭在香港新界沙田的林蔭大道上,目的地是香港中文大學(下文簡稱港中文)。

    小伙子年僅25歲,剛從香港科技大學結束博士生涯,拿到一封微軟原全球執行副總裁沈向洋的推薦信。他有兩個選擇,去美國如麻省理工這樣的高校繼續攻讀博士后,或直接在香港高校任教職,但沒想到香港中文大學直接給他發了offer。于是他投身于這所學術界圣殿,開啟了近20年的教職生涯,并持續至今。

    這個小伙子便是獨角獸企業思謀科技 SmartMore 創始人、董事長,香港中文大學終身教授賈佳亞。


    港中文「1026實驗室」往事:賈佳亞與他的學生們


    賈佳亞

    早期「攝影”器材”發燒友」是賈佳亞身上一個顯著的標簽。

    2000年前后,數碼單反相機剛出現時,一張圖像只有262萬像素,模糊、噪聲大、顏色不艷麗。

    賈佳亞常常盯著照片思考:「DSLR本來就是數字化的數據,沒有可能用先進計算機算法讓數字相機拍出來的圖像更漂亮?」

    正是這一尋常的好奇,點燃了他選擇研究計算機視覺最本真的初心,也成為了他終身的追求。

    時間回退到2000年,賈佳亞從復旦大學本科畢業。恰逢國家教育部和香港科技大學保送計劃選拔名額,排名前列的賈佳亞與劉江川(香港地區第一位微軟學者,IEEE Fellow,加拿大院士)以及陶宇飛(ACM Fellow,現港中文任教)被保送至香港科技大學。

    在香港科技大學讀博期間,出于對圖像的熱愛,賈佳亞在「AI黃埔軍校」微軟亞洲研究院最輝煌的時期做了許多相關研究,跟隨時任研究院視覺組長的沈向洋在第一線深耕后,希望在該方向繼續有所造詣。早期,他主要研究數字相機攝像頭相關的圖像問題,如圖像增強(去霧、去模糊、去噪聲、增強)、圖像平滑等。這個方向有個鮮明的標簽——“計算機早期視覺”,相對小眾,關注圖像視覺成像部分。他也是該領域的早期領軍人物。

    賈佳亞的好友、學生不止一個場合提到,他是一個無比勤奮刻苦的人,哪怕大年初一都在“肝”論文。

    2002年1月13日晚,微軟亞洲研究院燈火通明。這是中國傳統節日大年初一,亦是SIGGRAPH2002截稿日的前幾天,對于賈佳亞而言,這也是他連續五天通宵的日子。

    在此之前,他與孫劍(生前為曠視科技首席科學家、曠視研究院院長)等人已經花了三個月準備SIGGRAPH。每天工作很久,從10個小時到后來12-14個小時。臨近截稿,他們干勁反倒愈足,只是體力實在略感吃力。

    「做高端研究的終極理解:它其實不是腦力活,而是體力活」。

    在這之后的兩三年內,賈佳亞的名字頻頻出現在SIGGRAPH會議上。他和孫劍等人也是首批可以投SIGGRAPH論文的華人學者。

    待到2004年博士畢業時,賈佳亞的手里已經有兩篇SIGGRAPH,其中一篇他是一作,此外還有2篇TPAMI、3篇CVPR。CVPR、TPAMI均是計算視覺的頂級學會,SIGGRAPH更是擁有40多年歷史的圖形學頂級會議,SIGGRAPH論文被譽為業界的魔鬼級論文,中標率只有10%,對技術創新性上、寫作表達、demo展示等各個環節要求均十分嚴格。

    嚴格程度可通過一個細節佐證。如果你上網搜索SIGGRAPH,網上出現的攻略是《如何讓你的論文被拒》。

    科研碩果累累的賈佳亞,早已引起了港中文計算機系的注意。2004年,憑借出色的學術研究資歷和導師沈向洋的極力推薦,賈佳亞被港中文迅速錄取為助理教授。因為錄取時間接近年尾,賈佳亞要到第二年才能正式招生。于是他就自己單干了一年,其實這正合他意。

    自開始做研究以來,他自己摸爬滾打,艱苦奮斗,養成了不喜歡求人的習慣。有時,他是一個喜歡自己在前沿研究無人區探索的「獨行者」。

    因為拉不下面子,所以開口向學校要科研經費,成了賈佳亞一大挑戰。「那時候特別苦,經費也不多,自己探索的領域對外人而言很難明白」。

    2005年,賈佳亞正式開始招生,他意氣風發,定下了一個頗有雄心的目標:我要匯聚像我一樣的研究人員,去跟美國名校的頂級學者和學生去競爭,我要證明,我們團隊不輸他們。在清華計算機系的內部BBS上,賈佳亞丟出一道SIGGRAPH題目,并表示第一個做出來的人,就會成為他的麾下弟子。

    題目一出,20多個清華學子報名。但年輕單純的賈佳亞為了信守承諾,硬是只為「全力培養最好的研究人員」招了一人(其實答對題的同學都可以招進來),正式開始他的教職生涯。后話:這個學生就是熊偉Wayne Xiong – 從賈佳亞那里畢業10年后作為第一作者和微軟Fellow黃學東發表了一篇著名的論文(參見官宣:Microsoft researchers reach human parity in conversational speech recognition),宣布在計算機語音識別能力上用算法第一次超越了人的能力。此事按下不表。

    此后,賈佳亞也陸陸續續招了好幾個學生。組建團隊后,賈佳亞「嚴師」的名頭開始打響。早期發布SIGGRAPH的經歷練就了他在寫論文與做研究上的完美主義,亦拔高了他的眼界,在賈佳亞指導下,學生寫的論文幾乎都像藝術品一樣,從語法到每一張圖,都要反復雕琢。更為有趣的是,體力好,能打仗也成為了他對學生資質的要求之一。「做研究還是得身體好。」

    只是如此高的要求,使得賈佳亞在任教前五年,團隊里沒有博士生能順利達到他以自己的畫像為參照的要求,而難以拿到哲學博士(PhD)學位。他甚至一度覺得自己的要求是不是定得太高,這樣下去學校對賈佳亞升任副教授要求的——至少一個博士畢業——就達不到了。

    幸好世界這么大,不缺聰明而又身體好的學生。2007年,徐立加入了賈佳亞團隊。

    2、一代嚴師和一群頑徒

    在武林江湖上,一代宗師的背后,往往站有一群有能力的頑徒。

    這個定理同樣適用在賈佳亞身上。

    香港中文大學工程院依山而建,綠蔭環繞,工程院頂樓有個計算機視覺實驗室,賈佳亞的學生都在這個實驗室,門牌號是1026。

    實驗室人丁興旺,傳統良好,每天半夜都是燈火通明。研究生的習慣基本都是做科研到半夜,有時會議交稿期(deadline)來了,通宵也是常事。

    實驗室有一個供交流的圓桌。徐立來了之后,逐步把它發展成為打三國殺的場地。研究做到半夜,通常會招呼大家一起打一局,前提是系里的教授都離開了辦公室。

    那段時間里,賈佳亞往往是最后一個離開辦公室的教授。于是,年輕的學生往往被遣往偵察教授是不是離開了。這通常也是對新入學的師弟的考核:“學會如何偵察教授動向。”

    入學不久,新生就能熟練掌握這項技能。

    當然,凡事都有例外,有時大家已經開始了牌局,戰斗正酣,忽然實驗室門被打開,賈佳亞走了進來 (通常是走了之后又想起些什么再回來),七八個人面面相覷,動作石化。

    “Leo,你來了。”

    Leo是賈佳亞的英文名。

    體育界常常會形容某些球星自成體系,以此渲染他們的影響力,來到賈佳亞實驗室后,徐立也很快形成了自己的影響力,只是沒想到最先體現在帶大家娛樂上。

    徐立本碩畢業于上海交通大學,進入港中文時,賈佳亞已有了兩年的指導經驗,對招收優秀人才有了更多心得,例如他招生放寬了學歷要求,但是對學生的綜合能力提出了更高的要求。港中文「1026實驗室」往事:賈佳亞與他的學生們

    徐立

    在這種標準下,研究能力強、能說會道、頭腦靈活,極其聰明又自帶自由主義氣質的徐立,被賈佳亞一眼相中。賈佳亞和徐立的性格并不相似,甚至可以說有點相反。

    賈佳亞是一個完美主義者,他交給學生做的許多工作,看到學生做得不滿意,給他們講了幾次都聽不明白,或者學生對問題的理解沒有達到他的深刻程度,賈佳亞就會自己接過來做,自己把問題解決。賈佳亞審核論文非常認真負責。

    他還經常在覺得學生的論文實在差強人意之時拿來自己重寫。

    有一次,賈佳亞住院大手術,醒了第一件事就是把馬上要投稿的論文拿來一字一句的修改。他那時候不能忍受一句話中有明顯的英語語法錯誤和不專業的問題。

    當時賈佳亞的研究方向是“computational photography”(計算影像學),聚焦在前期視覺產生過程,包括摳圖(matting)、圖像重建(reconstruction)、超分(super-resolution)等,其中去模糊(deblurring)是圖像重建的一個重要方向。圖像去模糊顧名思義便是使得失真的圖像恢復到它本來的模樣。把一張模糊圖片交給人類設計師,處理起來也相當費力。因為圖像的模糊有很多種可能性:鏡頭的缺陷、相機的抖動、場景的運動、景深的限制、后期的處理等等,需要先判斷到底是哪里出問題了,此外還得對整個圖片模糊程度以及周圍布局進行預判。

    在沒有深度學習以前,賈佳亞的處理方式是思考如何把變模糊的數學過程還原回來。這個問題被認為是傳統圖像處理大方向中皇冠上的明珠,2006年前后都還是沒有合適的解法,里面涉及的非線性優化問題尤為棘手。類似的工作還有視頻去噪聲(denoising),就是把一個低解析度的圖像或視頻變成高清的視頻,不是單純的放大,而是使其看上去很自然。這一系列的工作并不是空中樓閣,而有實實在在的應用場景。當時賈佳亞在香港找了一些機構合作,這些技術會應用于修復老電影,還有香港警方的辦案中,早期Adobe里的PS技術和一些手機內置的圖像美化軟件應用了賈佳亞團隊的一系列算法。彼時的賈佳亞像一個精通視覺算法工藝的匠人,對算法精雕細琢,然后進行圖像的去模糊等工作,他也是圖像去模糊、濾波、圖像稀疏處理、多波段圖像信號融合等領域的代表性人物。

    總結而言,他所做的研究一直是在用計算機解決人眼看不到,看不清,看不細的事情。

    值得一提的是,賈佳亞團隊2008年發布在SIGGRAPH的“High-quality Motion Deblurring from a Single Image”是盲反卷積算法的經典文獻,是現代圖像處理的優化方法的基石之作,后來的很多高效算法都是對它的改進。再后來,徐立在此基礎上發表了一系列的更有效,更快速,更先進的算法,徹底奠定了傳統優化時代中,賈佳亞團隊在此領域的絕對領先地位。

    除此之外,在港中文任教期間,賈佳亞共發表了200多篇頂級論文,被引用超過6萬次。其算法產品界面日調用量已超過500萬次。

    港中文「1026實驗室」往事:賈佳亞與他的學生們

    香港中文大學賈佳亞研究成果資料展示

    說回徐立,徐立第一篇論文是關于深度視覺的,他之前沒有接觸過這個領域。

    徐立后面回憶道,“看過初稿后,賈佳亞不輕不淡地說了一句,「你能用人類能懂的語言寫文章嗎?」” 這句話一直成為之后師生之間的笑談。

    但徐立優于常人的點在于他一點就通,擅長舉一反三。同時善于溝通,會與導師反饋自己的進展,及時調整方向。到徐立寫第二篇、第三篇論文的時候,賈佳亞對他的干預就減少了。由于出色的學術表現,博士一年級徐立就獲得“微軟學者”的榮譽。港中文「1026實驗室」往事:賈佳亞與他的學生們

    徐立(右二)博士期間獲微軟學者

    2009到2011年期間,經常有行業的老師會拿徐立的文章作為上課的課件。

    因為他的文章代碼不超過100行,本科生就能復現出來,但觀點卻很有開創性。

    回顧徐立的學術生涯,成就可圈可點, 他三年完成博士學位,在視覺領域國際頂級會議、期刊上發表超過50篇論文,引用超過13000;三個算法獲得視覺開源平臺OpenCV(世界上最流行的計算機視覺庫之一)收錄,其中L0 Smoothing為圖形學期刊Transaction on Graphics (TOG) 五年論文引用之首(2011-2015)。這些成果都是他在創業之前完成的。每次頂會的Deadline來臨時候,師弟師妹們都很緊張,徐立還是很淡定,因為他能承受壓力時候理清楚優先級,規劃好每個步驟。甚至能在晚上有空帶著大家娛樂。

    「我人生中第一次知道,原來打牌打得好也是高智商、能做好學問的一個重要證明」賈佳亞說。

    而在賈佳亞的印象中,盧策吾是唯一一個不打牌的乖學生。港中文「1026實驗室」往事:賈佳亞與他的學生們

    盧策吾

    只不過,賈佳亞對盧策吾的好印象來源于一個美好的誤會。

    在大師兄徐立帶領實驗室集體打牌的那次,賈佳亞推門而入,全部的學生都在打牌,只有盧策吾在電腦面前。實際上盧策吾只是恰好要去掛程序所以才叫大伙先開打。(到盧策吾畢業前,賈佳亞都覺得盧策吾不打牌)。

    2009年,盧策吾在中科院碩士畢業,他在微軟亞洲研究院實習時就聽過其在圖像處理領域的大名和杰出成就,慕名申請賈佳亞的博士。

    SIGGRAPH Asia 2011 引用最高的論文“Image Smoothing via L0 Gradient Minimization”便是由盧策吾與徐立共同完成的。論文主要對圖像平滑(改善圖像質量的方法)進行了創新,以往一般的平滑方法是用一些平滑卷積核(比如高斯模糊核、均勻濾波等)濾波,模糊犧牲圖像的的邊緣,而這篇文章中提出一種基于梯度的平滑方法,在保留較大的梯度(圖像邊緣)同時去除較小的梯度(去噪、平滑)。想法很好,并且給出了優化問題的閉式解,實現過程很簡單,論文提供的代碼加上注釋只有幾十行,非常的通俗易懂。

    盧策吾是賈佳亞的第二個博士,「二師兄」是盧策吾對自己在團隊中的角色定位,只是他這個定位與真正的二師兄之間差了點距離,當時他體重不夠。

    賈佳亞對盧策吾的指導也的確盡心盡力。有一次盧策吾投頂會論文,在論文返修環節。因為評委的各種磨人要求,所有人都覺得希望渺茫。

    但是賈佳亞沒有放棄,加班加點進行修改。這其實與賈佳亞在研究上堅持的長期主義原則相關。在賈佳亞的世界,越是難以挑戰的事情才越有進行的意義。在賈佳亞的帶領下,團隊的凝聚力日益增強。在學術上,賈佳亞是學生們的導師,生活上更像一個大哥哥——本來年齡也相距不遠。

    盧策吾記得,來港中文的第一周,賈佳亞就帶大伙去爬了香港著名的遠足徑麥理浩徑。賈佳亞一邊舉起相機,一邊吆喝著要求大家站好。盧策吾對這一舉動感到有些震驚。「老師怎么屈尊給我們服務拍照」。

    后面才知道,原來賈佳亞不僅是個對相片質感和構圖十分在意的攝影迷,更是一個注重版權的「大藝術家」,實驗室的學生要寫論文時,如果要用照片,就會去賈佳亞的個人網站上下載,賈佳亞一邊笑著一邊強調:「要注明版權,寫明“Leo's photo”」。

    「他是一個精神世界上很豐富的人,有很多自己的興趣愛好」盧策吾說。

    賈佳亞個人網站上有一個“Photos”的專欄,記載著他從2003年開始的生活隨手拍、旅行見聞和與學生們的聚會、活動照片等等。其中生活隨手拍、旅行見聞等照片已有了年頭,沒有再更新,只有和學生們聚會的照片會“always updating”。照片中不少徐立、盧策吾、戴振龍、石建萍,以及沈小勇、劉樞、李睿宇和周超等人的身影。

    賈佳亞的圖片說明寫得非常幽默,跟他治學嚴謹的人設呈現出一種“反差萌”。例如在2011年5月一次和徐立、盧策吾、戴振龍等一群學生去戶外活動的照片中,大家擺著夸張的姿勢拍照,賈佳亞把這張照片命名為“狂舞——幸運的是沒有觀眾”;港中文「1026實驗室」往事:賈佳亞與他的學生們

    狂舞——幸運的是沒有觀眾

    2015年7月,畢業季,賈佳亞和劉樞、周超、齊曉娟等人下館子吃飯,大家拍照都擺出了標準笑容,而圖片說明是“告別晚宴——眼淚在哪里?”。港中文「1026實驗室」往事:賈佳亞與他的學生們

    告別晚宴——眼淚在哪里

    如此看來,學生們的“頑皮”一定程度上也是師承。

    除了一起出門游玩、吃燒烤、參加活動,賈佳亞也會與學生們聊人生談想法,提倡個性發展,也會時時鼓勵他們認清自己的目標,做正確而難的事情,從他實驗室出去的人除了這批專攻視覺的頂尖人才外,還遍布各行各業,包括量化交易等領域。

    2005年賈佳亞招入的第一個學生熊偉畢業后去微軟當工程師,期間沒有從事視覺研究;但他持續在微軟摸爬滾打,加入了微軟語音團隊,現在是微軟云和AI團隊的合伙人級別管理者(Partner Group Manager)。

    2009年到賈佳亞的團隊的戴振龍現在在量化交易公司WorldQuant做研究,沒有留在AI領域;同年加入的洪正浩是全球最頂尖100位編程大師之一,畢業后去了Quora(美國知乎),之后去了Robinhood(一家數據庫公司),現在就職于谷歌。

    2012年加入的張祺(寫出了只需要用一行代碼的“Rolling Guidance Filter”在去移除和平滑圖像中的復雜的小區域時,還能保證大區域物體邊界的準確性,在圖像處理領域具有劃時代的意義)畢業后去了Apple,2017年又跟Apple的一群同事出來創業,做了一個APP。

    「我培養的學生不一定要做研究,可以繼續科研,也可以去業界,可以做其他職業,也可以創業,只要他們喜歡、適合。研究思維應該是幫他們把路越走越寬,而不是越走越窄。」

    除了師父帶領的爬山活動,「大師兄」徐立帶領的出海活動也很熱鬧,徐立為人大方,組織能力強,出海的時候,從租船到吃飯,他一個人能安排地明明白白,還會多次掏腰包給大伙請客。在這樣的氛圍下,實驗的同學們親如一家,每天在一起十多個小時,笑聲實時充斥著1026。他們覺得自己會永遠生猛下去,什么也錘不了他們。時至今日,那份恣意和熱烈仍會使團隊里的眾人感到懷念。

    3、「大師兄」徐立的抉擇

    提及徐立,他身上被人熟知的是他現在商湯CEO的身份。

    徐立和商湯的故事發生在2014年。

    彼時,深度學習剛剛興起,徐立研究方向迅速結合深度學習。產業化的故事則發生在和湯曉鷗的一次飯局之后。湯曉鷗也是香港中文大學教授,被稱為全球人臉識別的“開拓者”和“探路者”。

    事后來看,當時的創業似乎是深度學習落地的必由之路。但在一切剛剛開始之際,徐立快速做了決策,加入創業的大軍。

    湯曉鷗和徐立等一眾聯合創始人以香港科學園為創業基地,成立商湯科技。

    這期間,香港AI科技產業發展勢頭卻在悄然間發生了變化,2014年深圳政府工作報告首提灣區經濟,加強與香港的聯系被提到前所未有的高度。2015年,香港特區政府創新及科技局成立,旨在壯大香港創科人才庫,推廣本地科創產品和服務;同年12月,作為技術交流平臺的香港科學院成立;特區政府設立了總額高達3億港元的“青年發展基金”,以助青年創業。

    商湯正好站在風口之上。

    在管理方面,讀博期間形成的抽象歸納思維和對新事物、新行業的領悟力亦深刻的影響了他,他會用數學公式將其他公司商業模式全部拿來做一個聚類,再進一步抽象,最后再提出一個適用于商湯的函數,用于團隊管理。

    而聽到徐立創業的賈佳亞,對此并不意外,對于自己的這個學生,賈佳亞一直都給予高度評價。

    「有些人的光芒是藏在貝殼里也壓不住的,徐立就是這種人」。

    4、深度學習浪潮下的轉變

    時針回撥到2012年,賈佳亞迎來另一個得意門生沈小勇。彼時的他剛從浙江大學度過8年的本碩時間,在碩士導師劉利剛(圖形學方向,與賈佳亞在微軟研究院相識)的推薦下,來到賈佳亞門下。港中文「1026實驗室」往事:賈佳亞與他的學生們

    沈小勇

    沈小勇是賈佳亞的第五個能畢業的博士,在此之前除了徐立、盧策吾外,還有石建萍、嚴瓊。

    當時實驗室有三個主攻方向,圖像的去模糊、圖像逆波器以及圖像對齊。

    沈小勇主要負責圖像對齊方向,“Cross-Field Joint Image Restoration via Scale Map”是他博士期間發布的第一篇論文,這是一個校企合作項目,研究將多個攝像頭的圖像融合在一起,拍出更清晰的圖像,也是在這個時期,賈佳亞團隊逐漸跟高通、華為等企業有了合作,積累與企業打交道的經驗。

    彼時的實驗室已經慢慢有了新的變化,狼人殺不再成為唯一的娛樂工具,頑徒們開始涉獵CS等網絡游戲。不同的是,賈佳亞撞見后,只會默默把門關好,不多言語。

    與這些細微變化一同發生的是團隊研究方向的轉變。2013年,賈佳亞團隊發布了第一篇深度學習論文。2014年、2015年賈佳亞團隊全面關注深度學習,團隊里的每個人手上都有兩三個關于深度學習的idea在做。

    而真正讓賈佳亞團隊在深度學習圖像研究領域的名聲一炮而響的是一篇題為“Pyramid Scene Parsing Network”的論文。2015年,賈佳亞團隊的石建萍畢業加入商湯,負責自動駕駛團隊。港中文「1026實驗室」往事:賈佳亞與他的學生們

    石建萍

    彼時的石建萍手里握著大量的計算資源,想參加2016年的ImageNet 場景解析挑戰賽,石建萍找到了賈佳亞實驗室的齊曉娟,彼時齊曉娟正在多倫多進行實習,只得遠程指導趙恒爽(剛進入賈佳亞實驗室第二年的博士生)進行,賈佳亞和王曉剛(商湯科技聯合創始人王曉剛)給予了非常關鍵性的指導。

    最后,論文在2016年 ImageNet 場景解析挑戰賽,PASCAL VOC 2012 基準測試和 Cityscapes 基準測試(當時最大的道路場景分割數據集)中均獲得第一名,在Google Scholar上引用度高達11120 次。

    也是在這個時間點左右,賈佳亞團隊在深度學習方向的研究已漸入佳境。

    參賽橄欖枝再次拋向賈佳亞團隊,只是這一次要打的MS COCO(圖像識別領域的權威標桿大賽)。石建萍向賈佳亞要人,意向人是當時才來實驗室不久的劉樞。港中文「1026實驗室」往事:賈佳亞與他的學生們

    劉樞參加胡潤百富U30創業領袖頒獎典禮

    劉樞本科畢業于華中科技大學,連續四年全系第一,2014年8月來港中文讀博,讀博方向十分堅定——深度學習。

    面對這個邀請,劉樞面露難色,因為競爭對手太強。

    2017年的MS COCO比賽是有史以來含金量最高的一年比賽,因為那一年的參賽者有孫劍(彼時是微軟亞研院首席研究員)、何愷明(憑借深度殘差網絡ResNet-152,擊敗谷歌、英特爾、高通等業界團隊的人工智能大神)、代季鋒(谷歌學術統計獲得了20000多次引用)、Ruslan Salakhutdinov(蘋果首任AI總監)等計算機視覺的大牛,競爭十分激烈。

    在賈佳亞的鼓勵下,劉樞最終還是選擇了接受挑戰。「失敗就失敗吧,無所謂,萬一成功了呢?」當時的劉樞帶了一個還沒有入學的師弟亓魯,再加上剛開始在北大讀碩士秦海芳,三個人組隊(石建萍的參與不多),拿下了COCO實例分割(instance segmentation)任務的第一名。

    這是COCO比賽最難的問題之一,因為需要分割每一個像素,判斷這個像素屬于哪一個類別哪一個實例。相對上一年的冠軍,劉樞團隊取得了9.1個點的提升,相對提升達24%。后來劉樞追隨老師賈佳亞創辦思謀科技,在公司里常被同事戲稱為“CO哥”,此乃后話。聽到這個消息時,賈佳亞很是高興,問劉樞是怎么做到的。

    這是一個淡然的回答,「和師父你一樣,熬。」

    為了這次COCO比賽,劉樞團隊連續6個月連軸轉,周六日基本沒有休息。有一天晚上,大家一起吃飯,還喝了點小酒,劉樞醉得不行,踉踉蹌蹌地走回實驗室,把實驗掛起來。

    「晚上人可以睡覺,但機器不能停」。

    2017年他們在MS COCO挑戰賽上的奪冠,實際上是賈佳亞團隊轉向深度學習后的一次標志性成果。

    贏了比賽之后,賈佳亞口中的劉樞從一個不知事的毛頭小子轉變為能擔大任的大將。

    這名大將同樣被當時已是商湯CEO的徐立盯上。劉樞和徐立吃了一次飯,對于這個師兄,劉樞此前并沒有打過多少交道,只是聽過他兩周趕出論文的壯舉。

    飯桌上,劉樞透露出自己對于找工作的迷茫。徐立便趁熱打鐵邀劉樞去商湯。

    劉樞只說自己考慮考慮。

    最后劉樞婉拒了商湯的邀請。

    原因是他要跟隨賈佳亞去另一個地方——騰訊優圖。

    但劉樞其實并不是第一個跟賈佳亞去優圖的學生,第一個是沈小勇。

    沈小勇做事很有規劃,十分理性,2017年正值他找工作之際,他此前考慮過入教職,但受到徐立的影響,覺得自己也想去產業界試試。

    彼時的他其實已經與華為諾亞方舟實驗室談了很久,第一想法就是去華為(因為他的愛人彼時在南京)。

    但當聽到賈佳亞對他說,要去騰訊創建一個AI實驗室,問他要不要一起過去時,沈小勇心里的那壺感性之水突然到達沸點。

    「我當然愿意!」

    改變和影響人很不容易。賈佳亞有一種潤物細無聲的力量,悄然之間讓人愿意跟隨。

    回憶起去騰訊優圖的決定,沈小勇仍滿眼星光。

    「我相信他,也認可他。在跟隨老師的過程中,我們確實得到了很好的成長,這是最重要的前提。一路過來,他始終在搭平臺,讓自己的學生不僅在學業上有很好的發展,也在事業上有更好的發展。Leo原先對我非常關照,我們兩也非常有默契,這讓我相信我們未來一定會創造出好的成績。」

    就這樣,除沈小勇、劉樞外,還有其他碩士博士六名團隊主力跟著賈佳亞加入了騰訊優圖。1026實驗室的產業探索也由此正式邁出了第一步。

    5、產業探索的第一步

    在賈佳亞的感知里,計算機視覺直到2015年才真正開始火起來。緊接而來的是2016年國內AI創業潮。

    在億歐發布的2016年AI企業Top50的榜單中,有46%是2015年或2016年成立。那是科學家們紛紛“下海”進公司的年代。

    2016,斯坦福大學人工智能實驗室主任李飛飛和前 Snapchat 研究主管李佳加盟谷歌,孫劍加入 AI 視覺創業公司曠視科技;何愷明加入了 Facebook(Meta);先后任職于微軟亞洲研究院和商湯科技的曹旭東創辦了自動駕駛技術公司 Momenta.......

    「不想白白愛過人工智能」一度成為當時初創公司的口號。

    也是在2016年左右,騰訊優圖找到了賈佳亞。彼時的騰訊內部已經有很多的AI團隊。

    優圖實驗室在人臉識別領域也已多次在MegaFace 、LFW等國際人工智能的權威比賽中刷新世界紀錄。作為騰訊優圖在人工智能布局的重要一子,騰訊許諾賈佳亞一進入便會是優圖實驗負責人,是 T5 級科學家,T5 級別在整個騰訊鳳毛麟角,代表人物有中國黑客界“TK教主”于旸、互聯網行業漏洞挖掘之王吳石等。

    賈佳亞在視覺研究上的耀眼履歷自不必說,他的團隊在比賽中多次奪冠,強大的技術與工程能力是賈佳亞的無法遮掩的光芒,而賈佳亞培養人才的能力則是騰訊尤為欣賞的地方。

    彼時,除了已成為商湯主力軍的徐立和石建萍外,賈佳亞實驗室畢業的盧策吾2015年去了斯坦福大學李飛飛的實驗室做博士后,歸國后,在2016年成為了上海交通大學的正教授,也被視為中國人工智能領域最有潛力的研究新星之一。賈佳亞另有不少學生都在百度、騰訊、商湯等科技公司任職,除此之外,還有很多學生在高校任教授職務。團隊開枝散葉,根系遍布整個中國計算機視覺界。

    而當時賈佳亞選擇騰訊優圖的原因則是看中了騰訊優圖能帶給他的優勢互補效應,優圖在視覺的很多領域都能做到產品在各個場景和云平臺落地。

    「我的學生不僅要有很好的學術發展,也要闖出事業的一片天,我得為他們搭平臺」。

    為學生構建一個平臺的想法久久盤踞于賈佳亞腦中。

    「我希望能把第一線研究創新的基因在騰訊平臺上強化和擴大。我的目標是在團隊里提供給尖端視覺科學家和一流研究人員所需的研發環境。我希望這些技術能夠產生論文,專利,放到產品里面,讓用戶看到這些產品,增強用戶體驗,豐富生活。」

    希望、目標、尖端、一流,這些詞匯交加在一起,彼時的賈佳亞無疑是「理想主義」的絕佳代名詞。

    開始產業探索之后,賈佳亞帶領下的騰訊優圖第一次出現在大眾面前是一場別開生面的發布會。2018年9月,中國上海,首屆計算機視覺峰會,賈佳亞一席西裝出現在大眾面前,主導了這場技術發布會。

    在會上,賈佳亞意氣風發,決心滿滿,他介紹了優圖的「一個核心、四大方向、十個領域」,給出了具體到每個領域的大量案例。

    在此之前,賈佳亞帶領優圖已蟄伏一年,2017 ,優圖實驗室在 ICCV(國際計算機視覺大會,計算機視覺頂級會議之一)上,共計入選 12篇論文,居業界實驗室前列,其中 3 篇被選做口頭報告,該類論文僅占總投稿數的2.1%(45/2143)。

    不過與外界看到光鮮亮麗不同,賈佳亞團隊剛去騰訊的時候其實很困難,第一沒有團隊,第二不清楚方向。賈佳亞用了將近半年的時間組建團隊,在騰訊內部頻繁“刷臉”幫同事解決五花八門的需求來推銷自己的團隊。工作強度也跟在實驗室差不多,晚上10點左右下班,周六周日有時候也會去公司。

    轉折點發生在2018年9月30日。騰訊宣布組織架構調整,公司業務從To C全力轉向To B。在組織架構調整前,騰訊優圖的能力主要輸出給QQ、天天P圖等騰訊內部產品;調整后,視覺AI能力拓展至賦能騰訊云業務以及外部的生態合作伙伴。

    之前騰訊的很多AI團隊都是各自為政,在優圖實驗室的助力下,騰訊的AI團隊逐漸出現了一個多模態技術中臺。賈佳亞團隊業務涉及多個領域,如工業檢測等。在這個過程中,賈佳亞發現,這些高難度技術一旦形成,就會存在壁壘。在檢測不同產品的瑕疵中,需要不斷優化服務(類似AutoML),所以他們就設計了一個自動化的算法構建流程,幫助客戶解決問題。優圖實驗室逐漸成為公司的核心技術落地團隊,2019年,騰訊AI業務相當部分都是優圖在支撐。

    對于賈佳亞來說,這是一次了不起的轉身。除了技術落地,技術本身的升華也未間斷。在賈佳亞的任職期間,優圖實驗室取得700多項全球專利,僅CVPR(計算機視覺領域的全球頂級會議)就有25篇論文被收錄。他本人也獲得了2018年IEEE Fellow。IEEE Fellow(IEEE會士)為學會最高等級會員,是IEEE授予成員的最高榮譽,是學術界和科技界公認的權威榮譽和重要職業成就。當選人數不超過IEEE當年會員總人數的1‰,當選那年賈佳亞39歲。

    港中文「1026實驗室」往事:賈佳亞與他的學生們

    2001年到2017年,IEEE Fellow提名(上)和當選(下)人的年齡分布,無論是提名還是當選,都是50~54歲年齡段最多,而31~39歲的候選人被稱為青年才俊可謂實至名歸。


    騰訊組織架構調整后,業務形態更加多樣化,對于賈佳亞而言,他自身的成長也迎來了重要更新——來自于一個液晶面板生產公司大單。液晶面板生產工藝十分精密,涉及上百道工序。稍有差池,便可在生產過程中出現120種面板缺陷種類。高度依賴工序的優良和產品原材料的質量。

    而這千變萬化的面板缺陷類似如果交給人工來識別,既難又十分低效。但賈佳亞團隊在刻苦攻關后設計的人工智能質檢算法可以在5秒內識別出面板缺陷,減少六成質檢人員。通過對面板不同缺損的分析,團隊還幫工廠找到問題的源頭,調整特定環節的生產工藝,提高良品率。但就在此時,問題出現了,現實和理想之間往往存在差距。

    賈佳亞手里面沒有可以直接管理的銷售、BD和產品人員。如果不能直接優化前后端管理,研發離最后的落地應用和客戶實在相隔甚遠。一個負責人工智能的解決方案的銷售需要達到的水平并不僅僅是會做PPT,還需要懂技術,又要實時跟上產品的迭代速度。

    這些壁壘很難一時間突破,只能科學家教,這導致團隊決策鏈路長、溝通成本高。

    顯示面板項目基本完成之后,賈佳亞漸漸萌生創業的想法,雖有騰訊高層的極力挽留,他最終選擇離開。

    彼時的賈佳亞40歲,不惑之年。

    幸運的是,轉變往往是新輝煌的開始。

    6、未完待續的黃金時代

    2019年,香港出現暴力事件,港中文視覺實驗室的同學想從香港回來,商湯包了車,把大家給拉回大陸,也包括賈佳亞在香港的學生。

    賈佳亞感慨,「還是要有一番屬于大家的事業和平臺,才能把大家保護好。」

    為學生搭平臺的想法再次萌生。

    也是在這個冬天,賈佳亞接受了來自IDG的牛奎光的投資建議。彼時牛奎光已經是IDG的資深合伙人,已經不看早期的創業項目。

    但是賈佳亞讓他最后一次出山,做了思謀科技的天使投資人。

    后來一個晚上賈佳亞撥通了一跨洋電話。電話那頭是真格基金創始人徐小平,接到電話后,徐小平與賈佳亞暢聊了幾個小時,隨后,徐小平做了一個決定,也加入投資思謀科技的隊伍中。

    彼時的思謀科技剛剛成立,由賈佳亞帶隊,匯聚了沈小勇、周超、李睿宇和劉樞等多名學生。辦公室設在深圳三航科技大廈,只租了其中一個房間,裝修時桌子都沒有擺滿。

    2020年6月,思謀科技宣布完成數千萬美元Pre-A輪融資,由IDG資本領投,真格基金和聯想創投跟投。四個月后,思謀科技拿到了超1億美元的A輪融資,新投資方包括紅杉中國、松禾資本、基石資本、聞天下投資等。如此快速的吸金速度引爆了創投圈。

    思謀科技的辦公室也逐漸擴大,從三航大廈的一個房間擴展至半層,再到一層、兩三層,后來人員太多,只得搬到前海嘉里中心,現在辦公室足足有三層半。

    以往在面板生產的經驗使賈佳亞有感于計算機視覺在工業生產優化上的神奇作用,在啟動思謀科技時,他就確定了接下來的賽道:工業制造。

    思謀一開始想做的事情介于AI與設備公司之間。

    對于賈佳亞團隊而言,最容易的事情是將思謀變成一家AI公司,提供SDK,但對工業里的客戶來說,這遠遠不夠,因為客戶要的不是SDK,而是能夠運動的整體機器。以區間檢測為例,需要把手機從產線上拿起來,將其拍照成像,然后傳送給算法檢測表面的合格線,再放回產線,只有完整提供這些功能,才能夠解決終端客戶的完整需求。如果不能,只對接集成商,問題便會出現。

    另外,如果只做軟件,也可能被替換掉,所以思謀迅速轉變思路,創新自己的商業模式,開始大刀闊斧進入機械電氣光學領域做高端制造和檢測設備。這種變化,像極了當時在研究領域爭分奪秒趕論文提交的日期,也像極了為了追求科研競賽第一的成績,每天都在嘗試新方法和新思路。

    AI設備公司這個賽道有實際的創收點,門檻很高,做得好做得踏實更難。僅從定位來看,其實已經敏銳的契合了當下智能制造時代的發展需求。

    現在,思謀科技人才隊伍已逐漸強大,團隊中不僅有全球領軍互聯網企業的人才,還有來自傳統制造業一線的全鏈條技術人才。

    工業領域的大模型,是賈佳亞在思謀科技的新使命。

    就在6月底,思謀科技宣布行業首個工業大模型開發與應用底座SMore LrMo正式發布。

    關于落地應用,思謀科技已主導完成多個大型智能制造項目,相關產品涵蓋新能源、消費電子、汽車制造、精密光學、教育與科研等領域,合作伙伴遍及超兩百家世界500強等國內外龍頭企業。

    賈佳亞本人的角色也在不斷轉換,完美完成了從科學家到科學型企業家,再到企業型科學家的轉型。學術上他榮譽加持,他自2021年起擔任計算機領域頂會期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)的副主編,是該期刊創刊43年以來首位視覺領域華人副主編。他還是國際計算機視覺雜志(IJCV)的編委會成員。此外,賈佳亞還擔任CVPR 2021、AAAI 2021 和 ICCV 2021 等多個國際頂級人工智能會議的區域主席。

    教育上他桃李滿天下,自2005年招入第一個學生至今,賈佳亞團隊中有 40 多名博士和研究員現在活躍在學術界和工業界,并已成為杰出的人工智能技術領導者,擔任教授、主要研究實驗室的主任以及多家成功初創公司的創始人。他現在還帶領著超過三十個博士生的超大學術團隊每天在科研第一線研發新的視覺語言大模型和其它AI技術。他創立的DV Lab 每年發布超過30項成果,全部開源在線。

    創業上,他始終迎難而上,思謀科技的整個光學成像系統,既能夠感知到多光譜的圖像,又能感知到非常細小的東西。在工業質檢上,小樣本學習的準確度已經遠遠超過人類,人做檢測準確率可能只有90%,但機器可以做到99.99%以上的準確率。

    而當年在實驗室玩鬧、打牌的年輕人,到了如今,已經奔赴在各個賽道之上。騰訊優圖之后,賈佳亞實驗室的學生分散全球各個行業,他們一直帶著對圖像之美的追求,以更旺盛的斗志和多為行業創造更多的利益的目標繼續自己的工作,永遠行進著。

    屬于他們的黃金時代仍在繼續。


    雷峰網 雷峰網(公眾號:雷峰網)



    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    港中文「1026實驗室」往事:賈佳亞與他的學生們

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說