谷歌和 OpenAI 強強聯手找到了神經網絡「黑盒子」的正確打開方式！

本文作者： WBLUE

編輯：幸麗娟

2019-06-21 15:19

導語：代碼呈上，開發者可以親自動手打開！

雷鋒網 AI 科技評論按：現代神經網絡經常被吐槽為「黑盒子」。盡管它們在各類問題上都取得了成功，但我們仍無法直觀地理解它們是如何在內部做出決策的。隨著人工智能系統被應用到更多重要的場景中，更好地了解其內部決策過程將有助于研究者能夠及時發現其中的缺陷和錯誤。對此，谷歌 AI 研究院與 OpenAI 一起合作提出了能夠弄清這個「黑盒子」里面到底有什么的新方法——激活圖集。谷歌在博客上發布文章介紹了這一意義重大的成果，雷鋒網 AI 科技評論編譯如下。

神經網絡已成為圖像相關計算任務中的實際標準，目前已被部署在多種場景中：從自動標記圖像庫中的照片到自動駕駛系統，我們都能看到神經網絡的身影。鑒于機器學習系統的在執行方面的準確性比不使用機器學習、直接由人為設計的系統更好，機器學習系統開始變得無處不在。但是，由于這些系統所了解的基本信息都是在自動訓練過程中學習到的，因此我們對于網絡處理其給定任務的整個過程的了解，有時仍然隔著一層紗。

近期，經過與 OpenAI 同事的通力合作，我們在發表的《用激活圖集探索神經網絡》論文中（「Exploring Neural Networks with Activation Atlases」，論文地址：https://distill.pub/2019/activation-atlas）論文中，描述了一種新技術，旨在幫助回答「給定一張圖像時，圖像分類的神經網絡能“看到”什么」的問題。激活圖集提供了一種融入卷積視覺網絡的新方法，為網絡的隱藏層內部提供了一個全局的、層級化和可解釋的概念綜述。我們認為，激活圖集揭示了機器針對圖像學到的字母表，即一系列簡單、基礎的概念，它們被組合并重組進而形成更復雜得多的視覺概念。同時，我們還開源了部分 jupyter notebooks 的代碼，以期幫助開發者們開始制作自己的激活圖集。

InceptionV1 視覺分類網絡其中一層的激活圖的詳細視圖。它展示了網絡用于對圖像進行分類的許多視覺檢測器，例如不同類型的水果狀紋理，蜂窩圖案和類似織物的紋理。

下面顯示的激活圖集是根據在 ImageNet 數據集上訓練的卷積圖像分類網絡 Inceptionv1 構建的。通常，給分類網絡輸入一張圖像，然后令其標記出該圖像屬于 1000 個預定類別中的哪一類，例如「意大利面」，「通氣管」或「煎鍋」。為此，我們通過一個約十層的網絡來評估圖像數據，該網絡每層由數百個神經元組成，且對于不同類型的圖塊，每個神經元在圖像塊的激活程度不同。某層中的一個神經元可能對「狗耳朵」圖像塊的激活程度更大，而另一層的另一個神經元可能會對高對比度的「垂直線」圖像更敏感。

我們從一百萬張圖像的神經網絡的每個層中收集到了內部激活圖，并構建了一套激活圖集。這些激活圖由一組復雜的高維向量表示，通過 UMAP 投影到有用的二維布局中，其中 UMAP 是一種保持原始高維空間局部結構的降維技術。

這就需要組織激活向量，并且因為激活圖太多而無法一目了然，所以我們也需要將它們整合成一個更易于管理的數量。為此，我們在之前創建的 2D 布局上提前繪制好了網格。對于網格中的每個單元格，我們對位于其邊界內的所有激活取均值，并使用特征可視化來創建圖標表示。