成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給camel
    發送

    0

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    本文作者: camel 2017-08-04 13:28 專題:ACL 2017
    導語:ACL 2017大會公布了今年的終身成就獎和五篇最佳論文獎

    雷鋒網 AI科技評論按:在昨天結束的ACL 2017大會的正會上,分別公布了今年的終身成就獎和五篇最佳論文獎。本篇文章雷鋒網將帶你一塊兒來解讀其中的最佳長論文《Probabilistic Typology: Deep Generative Models of Vowel Inventories》。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    在了解這篇文章之前,首先需要了解一些語言類型學的知識。根據語言類型學的研究,發現任何一種人類語言都有元音,例如英語中的[i], [u], [?]等,把所有語言中的這些元音收集起來(目前收集的大概有600多個獨立的元音)就構成了一個元音集合。這些元音通常情況下可以用其音頻的前兩個共振峰 (F1, F2)來表示,這樣就構成了一個2維的元音空間。在這個空間中,每一個元音都可以用一個向量f(F1,F2)來表示。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    在語言類型學中對于元音有兩個基本的定律:

    其一,在一門語言中元音的音位必須相對較為分散,這樣才能讓聽者能夠很容易地辨別出它們,也即分散性。

    其二,在所有語言中,并不是所有的元音都會出現,有些元音出現的頻次較高,而有些則只在個別語言中出現或不出現,即聚焦性。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    本篇論文即想要通過神經網絡學習方法來對元音空間構建一個可訓練的生成概率型分布方法,從而來研究語言類型學中的元音的分散性和聚焦性問題。

    那么具體如何來研究呢?其實很簡單,就是選定一種概率評分方法。作者考察了三種評分方法,分別為伯努利點過程(BPP)、馬科夫點過程(MPP)和特征值點過程(DPP)。

    其中第一種方法(伯努利點過程 )只是元音概率的乘積,所以只考慮了元音的聚焦性,而沒有考慮元音之間的分散程度。其公式為

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    第二種評分方法中,元音概率和前一種方法一致,但是同時考慮了元音之間的聚合程度,這種方法就彌補了前一種方法分散性的問題。其公式為

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    第三種評分方法,基本的考慮就是把兩個元音向量乘積所得作為其評分標準。整體來考慮的話就是所有元音向量乘積構成的矩陣(稱為Gram矩陣)的行列式構成其評分標準。其公式為

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    但是其中的向量e(vi)如何獲得呢?在此之前人們通常是使用人工的方法,通過一種音頻能量最優解之類的方法來獲得。而作者此處選擇了神經網絡訓練的方法。首先,作者選用國際音標中的53個音標作為學習訓練的數據集。然后分別選用三種神經網絡嵌入學習方法——神經嵌入(u)、可解釋神經嵌入(i)、基于原型嵌入(p)。我們以神經嵌入為例,文章中選用下面這個公式來獲得前饋神經網絡

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    其中的f(vi)為元音向量,其他幾個參數向量都將是通過學習訓練獲得,而e(vi)就是神經嵌入學習的結果。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    通過嵌入學習方法獲得的元音空間流形則能夠更好地反映每個元音的概率型。將嵌入學習的結果e(vi)代入到前面的評分標準中,即可以評價每一個元音的聚焦性和每一種語言中元音的分散性。

    其試驗結果如下圖所示(第一行中數值越小越好,下面百分比則是越大越好),其中u代表沒有使用可解釋的神經嵌入,i表示可解釋神經嵌入,p表示基于原型的神經嵌入。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    在這篇文章之前,學者們研究元音的這兩個問題(分散性和聚焦性)通常是基于能量最優化的方法,即認為元音的前兩個音頻能量差越小聚焦性就越大,不過這種方法沒法同時考慮分散性問題。而這篇文章通過概率打分可以輕而易舉地同時分析這兩個問題。

    另外,為什么大部分語言包含的元音個數在5-7個之間呢?這也是傳統人工方法所不能解決的,而在這里通過競爭的方法可以挑選出所有潛在較優(概率較大)的元音集。

    當然,這篇文章中只使用了53種語言的元音作為數據集,而地球上目前有7105種語言,文章中的結果可能并不代表人類語言中元音的基本規律。不過沒關系,只要有數據,按照同樣的范式做再做一遍就好了。

    同樣的,這種使用神經網絡訓練來生成概率的方法不是只能使用在人類語言中元音問題上的,它更具有普適性,我們可以用同樣的思路來研究語言中的輔音、詞性、句式等等?;蛟S,這篇文章將是我們用人工智能方法來研究、優化甚至創造語言的新起點。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    我們知道在《權利的游戲》中東方大陸草原上有一個戰斗民族多斯拉克,他們說著我們誰都聽不懂的多斯拉克語。這種語言在《權利的游戲》播出之前是從來沒有在地球上出現過。它是由當時年僅28歲的語言學家大衛·彼得森所創立。也許以后某一天,我們使用人工智能可以創造出更優雅的新語言。

    雷鋒網(公眾號:雷鋒網):查看原文

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

    ACL 2017 最佳長論文,帶你創造一門優雅的新語言

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說