AIR 028 | 南京大學LAMDA所長周志華：機器學習的現狀與未來

本文作者：李尊

2016-08-13 08:29

導語：機器學習中每過五年、十年，就會有一種新的技術在當時變得非常流行。

周志華，南京大學教授，計算機科學與技術系副主任，軟件新技術國家重點實驗室常務副主任，機器學習與數據挖掘研究所（LAMDA）所長；ACM杰出科學家，IEEE Fellow，AAAI Fellow, IAPR Fellow，中國計算機學會會士；長江學者特聘教授，國家杰出青年基金獲得者。

在 2016 CCF-GAIR 全球人工智能與機器人峰會上，周志華教授接受了雷鋒網的采訪，分享了他對于機器學習的現狀以及未來的看法。

| 深度學習技術在機器學習中的地位

對于普通大眾來說，可能深度學習這個概念十分的熱門。其實在去年機器學習領域中頂級學術會議NIPS2015(編者注：Neural Information Processing Systems，是神經計算方面最好的會議之一)中只有9%的投稿來自深度學習，相關論文總數在11%，總體上占10%左右。雖然在研究界來說只有百分之十，但是可能在大眾看來就有百分之九十了。我認為在未來，必然會有其他技術可能達到或者超越深度學習技術目前的地位。

| 神經網絡的熱潮

神經網絡學習是機器學習的一個分支，它特別熱門是因為在圖像、視頻、語音方面取得了巨大的成功。而這些方面恰巧是普通大眾比較能了解到的方面，所以造成大家有這種觀點——感覺“神經網絡特別熱門。”其實也有其他機器學習方法在各自的領域也取得了巨大成功，但是一般大眾對相關方面了解較少，所以對于神經網絡可能了解得更多一些。

| 目前深度學習的一些進展

其實在機器學習中很多都是相同的，所謂深度學習——把它看成一種語言，它也并不是和以前的方法那么截然不同。可以把它當作一種描述方式，以前的很多內容我們把它用這種方式描述出來。其實今天的深度學習領域已經融入很多以往機器學習中的很多機理，它們本身其實是想通的，包括一些共性的理論問題，也都是一樣的。

| 中國的機器學習研究和美國的差距在哪兒？

其實來說，整個中國的人工智能領域應該說可能是在計算機科學界里面是和國際的水平最接軌的之一（從很多指標上都能反應出來）。中國的相關研究水平和國外比的話，我們最強大的領域其實與國外已經沒有差距了。但是，我們的研究厚度可能不夠。比方說我們可能在某一方面到了一個比較高的位置，但是在其他方面可能還有缺乏，畢竟在這一領域發展起來還是晚了幾十年。

| 機器學習的下一步怎么發展？

機器學習的下一步其實會往各種方向發展，一個大的趨勢是因為不同類型的數據會越來越多，所以需要分析的數據也會越來越多。每一個新的任務都需要一種新的技術，可以說是往外輻射的一個狀態。往后有很多任務可能都需要新的機器學習技術，但是一個大的趨勢是我們要增加機器學習的魯棒性。這個是非常大的需求，因為在目前情況下很多研究中機器能達到人類的水準，甚至比人類的狀態還要好。但是如果遇到一些罕見的情況，它會錯得非常離譜。在有些應用中，這種情況是大家十分不愿意看到的。例如無人駕駛，開的好時比一般的司機都要好，但是如果表現不好的話，產生的后果就無法估計了。

雖然現在在技術上可能是百花齊放往外各種輻射，但是在其他方面還是有很多需要做的。

| 在實踐中很多深度學習的研究學者都戲稱“性能不夠，加錢來湊”，怎么看待這種說法？

這種看法其實不是很對——因為增加了層數之后，模型的復雜度更高，可以吃下去更多的數據。但是吃下去之后，模型的性能會不會變好？這個倒不一定。如果本來只需要一百層，你做到一百二十層，其實性能反而會變壞。樣本的復雜度和模型的復雜度要恰到好處，過猶不及。

| 在深度學習領域中是否有量化復雜度的方法

在參數和學習理論上來說是可以做到的，但是神經網絡的機理存在較多的“trick”。很多人去嘗試做，也試出了很多不同的做法。但是做理論分析的門檻非常高，要找到共性的地方，才能做理論分析。現在大家都在盲目去嘗試，結果也都還不錯，所以相應的理論分析跟不上了。

| 研究成果的應用

計算機科學是應用驅動的研究，可以這樣說中國目前幾個領先的互聯網公司、通訊公司以及一些跨國企業，我們都有合作。通常來說是當他們遇到一些數據分析問題的時候，現有方法無法解決的話，我們提供給一套解決方案。但是從大眾的角度來看的話，他還是原本的那些金融公司、防火墻公司、駕駛公司等。

| 目前機器學習領域學術界與產業界的聯系

現在產業界與學術界的聯系比以前強得多，很重要的一個原因是國內的IT企業發展起來了。可以說十年之前我們做機器學習出來的一些成果已經很有用了，但是產業界當時還沒有這個需求。其實產業界對于深度學習方面，可以看成不愁明天的吃喝，是在考慮一個星期之后的問題，這個時候你才用的上這些技術。其實也可以說等經濟發展到一定程度，企業也相應發展到一定程度，這些技術可能就比較有用。一旦發現有用之后，就會帶動一些行的企業跟進，其實也是一個帶動式的過程。