ACL 2017 最佳長論文，帶你創造一門優雅的新語言

本文作者： camel

2017-08-04 13:28

專題：ACL 2017

導語：ACL 2017大會公布了今年的終身成就獎和五篇最佳論文獎

雷鋒網 AI科技評論按：在昨天結束的ACL 2017大會的正會上，分別公布了今年的終身成就獎和五篇最佳論文獎。本篇文章雷鋒網將帶你一塊兒來解讀其中的最佳長論文《Probabilistic Typology: Deep Generative Models of Vowel Inventories》。

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

在了解這篇文章之前，首先需要了解一些語言類型學的知識。根據語言類型學的研究，發現任何一種人類語言都有元音，例如英語中的[i], [u], [?]等，把所有語言中的這些元音收集起來（目前收集的大概有600多個獨立的元音）就構成了一個元音集合。這些元音通常情況下可以用其音頻的前兩個共振峰 (F1, F2)來表示，這樣就構成了一個2維的元音空間。在這個空間中，每一個元音都可以用一個向量f(F1,F2)來表示。

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

在語言類型學中對于元音有兩個基本的定律：

其一，在一門語言中元音的音位必須相對較為分散，這樣才能讓聽者能夠很容易地辨別出它們，也即分散性。

其二，在所有語言中，并不是所有的元音都會出現，有些元音出現的頻次較高，而有些則只在個別語言中出現或不出現，即聚焦性。

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

本篇論文即想要通過神經網絡學習方法來對元音空間構建一個可訓練的生成概率型分布方法，從而來研究語言類型學中的元音的分散性和聚焦性問題。

那么具體如何來研究呢？其實很簡單，就是選定一種概率評分方法。作者考察了三種評分方法，分別為伯努利點過程（BPP）、馬科夫點過程（MPP）和特征值點過程（DPP）。

其中第一種方法（伯努利點過程）只是元音概率的乘積，所以只考慮了元音的聚焦性，而沒有考慮元音之間的分散程度。其公式為

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

第二種評分方法中，元音概率和前一種方法一致，但是同時考慮了元音之間的聚合程度，這種方法就彌補了前一種方法分散性的問題。其公式為

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

第三種評分方法，基本的考慮就是把兩個元音向量乘積所得作為其評分標準。整體來考慮的話就是所有元音向量乘積構成的矩陣（稱為Gram矩陣）的行列式構成其評分標準。其公式為

ACL 2017 最佳長論文，帶你創造一門優雅的新語言

但是其中的向量e(vi)如何獲得呢？在此之前人們通常是使用人工的方法，通過一種音頻能量最優解之類的方法來獲得。而作者此處選擇了神經網絡訓練的方法。首先，作者選用國際音標中的53個音標作為學習訓練的數據集。然后分別選用三種神經網絡嵌入學習方法——神經嵌入（u）、可解釋神經嵌入（i）、基于原型嵌入（p）。我們以神經嵌入為例，文章中選用下面這個公式來獲得前饋神經網絡

ACL 2017 最佳長論文，帶你創造一門優雅的新語言