成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給叢末
    發(fā)送

    0

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    本文作者: 叢末 2019-01-01 11:38
    導(dǎo)語:多任務(wù)的自然語言處理,可以使用一個(gè)共享模塊,同時(shí)進(jìn)行詞法分析、句法分析以及任務(wù)這幾項(xiàng)任務(wù)。

    雷鋒網(wǎng) AI 科技評(píng)論編者按:過去幾年,深度學(xué)習(xí)在自然語言處理中取得了很大的進(jìn)展,但進(jìn)展的幅度并不像其在計(jì)算機(jī)視覺中那么顯著。其中一個(gè)重要的原因是數(shù)據(jù)規(guī)模問題。多任務(wù)學(xué)習(xí)是將多個(gè)任務(wù)一起學(xué)習(xí),充分挖掘多個(gè)任務(wù)之間的相關(guān)性,來提高每個(gè)任務(wù)的模型準(zhǔn)確率,從而可以減少每個(gè)任務(wù)對(duì)訓(xùn)練數(shù)據(jù)量的需求。

    近日,在雷鋒網(wǎng) AI 研習(xí)社公開課上,復(fù)旦大學(xué)計(jì)算機(jī)系在讀碩士陳俊坤分享了其所在研究組關(guān)于多任務(wù)學(xué)習(xí)在自然語言處理領(lǐng)域的最新工作。公開課回放視頻網(wǎng)址:

    http://www.mooc.ai/open/course/574?=chenjunkun

    分享嘉賓:

    陳俊坤,復(fù)旦大學(xué)計(jì)算機(jī)系在讀碩士,導(dǎo)師是邱錫鵬副教授,主要研究方向?yàn)樽匀徽Z言處理,多任務(wù)學(xué)習(xí)等。其研究工作曾在 AAAI, IJCAI 上發(fā)表。

    分享主題:自然語言處理中的多任務(wù)學(xué)習(xí) & 復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室介紹

    分享提綱:

    1、復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室介紹

    2、基于深度學(xué)習(xí)的自然語言處理

    3、深度學(xué)習(xí)在自然語言處理中的困境

    4、自然語言中的多任務(wù)學(xué)習(xí)

    5、多任務(wù)基準(zhǔn)平臺(tái)

    雷鋒網(wǎng) AI 研習(xí)社將其分享內(nèi)容整理如下:

    本次的分享主要有兩個(gè)目的:一是介紹一下復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室的相關(guān)工作;二是讓愿意攻讀研究生的同學(xué)對(duì)國(guó)內(nèi)實(shí)驗(yàn)室有更多的了解,從而在選擇攻讀研究生上更有目標(biāo)性。

    復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室介紹

    分享之前,先進(jìn)行一下自我介紹,我目前在復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室攻讀研三,師從邱錫鵬副教授,現(xiàn)在也是字節(jié)跳動(dòng) AI Lab 的實(shí)習(xí)生,研究方向主要是自然語言處理、多任務(wù)學(xué)習(xí)和遷移學(xué)習(xí)。今天的分享,我會(huì)重點(diǎn)講一下多任務(wù)學(xué)習(xí)。

    另外介紹一下復(fù)旦大學(xué) NLP 實(shí)驗(yàn)室,它致力于利用機(jī)器技術(shù),理解和處理人類語言,擁有國(guó)內(nèi)領(lǐng)先的團(tuán)隊(duì),實(shí)驗(yàn)室的老師都有非常豐富的經(jīng)驗(yàn)。我所在的研究組主要聚焦于深度學(xué)習(xí)和自然語言處理領(lǐng)域,包括語言表示學(xué)習(xí)、詞法/句法分析、文本推理、問答系統(tǒng)等方面,指導(dǎo)老師是邱錫鵬副教授,近幾年來,我們發(fā)表國(guó)際頂級(jí)會(huì)議/期刊 50 余篇,還獲得了 ACL 2017 杰出論文;在 SQUAD 2.0 上獲得第二的成績(jī),并在 SQUAD 1.1 上多次獲得第一;另外我們也開發(fā)開源自然語言處理系統(tǒng),希望能幫助大眾解決更多問題,其中包括 FudanNLP(國(guó)內(nèi)最早的開源 NLP 系統(tǒng)之一)、fastNLP(一個(gè)模塊化、自動(dòng)化、可擴(kuò)展的 NLP 系統(tǒng))。

    本次自然語言處理的報(bào)告綱要包括:

    • 自然語言處理簡(jiǎn)介

    • 基于深度學(xué)習(xí)的自然語言處理

    • 深度學(xué)習(xí)在自然語言處理中的困境

    • 自然語言處理中的多任務(wù)學(xué)習(xí)

    • 新的多任務(wù)基準(zhǔn)平臺(tái)

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    自然語言處理簡(jiǎn)介

    首先簡(jiǎn)單介紹一下自然語言語言處理這個(gè)概念。

    我們知道圖靈測(cè)試是指,當(dāng)一個(gè)人與機(jī)器對(duì)話時(shí),他無法判斷對(duì)方是機(jī)器還是人,那機(jī)器就通過了圖靈測(cè)試。這就引出了自然語言處理的核心:讓機(jī)器去理解和生成自然語言。

    那什么是自然語言處理?我們可以大致將其理解為人類語言,區(qū)別于程序語言等人工語言。自然語言處理任務(wù)包括語音識(shí)別、自然語言理解、自然語言生成、人機(jī)交互以及所涉及的中間階段,目前可以歸為是人工智能和計(jì)算機(jī)科學(xué)的交叉子學(xué)科。

    從技術(shù)上進(jìn)行總結(jié),可以分為三個(gè)層面:基礎(chǔ)技術(shù)、核心技術(shù)和應(yīng)用:

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    自然語言處理的難點(diǎn)在于歧義性,以下我以中文分詞為例進(jìn)行說明:

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于自然語言處理的難點(diǎn)的具體講解,請(qǐng)回看視頻 00:05:35 處)

    自然語言處理的發(fā)展歷程可以這樣總結(jié): 在 1990 年以前,多基于規(guī)則的方法進(jìn)行自然語言處理;90 年代以后,逐漸引入一些統(tǒng)計(jì)學(xué)習(xí)的方法;目前,自 2012 年開始,隨著的深度學(xué)習(xí)的熱潮,開始基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)端到端的訓(xùn)練進(jìn)行自然語言處理。總之,自然語言處理就是一個(gè)理解語言(文本到機(jī)器)、生成(機(jī)器到文本)再到交互的過程。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    那對(duì)于人來說,理想中的自然語言處理流程是怎樣的呢?

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于理想中的自然語言處理流程的具體講解,請(qǐng)回看視頻 00:08:10 處)

    基于深度學(xué)習(xí)的自然語言處理

    下面講一下基于深度學(xué)習(xí)的自然語言處理是怎樣的。首先講一下如何在計(jì)算機(jī)中表示語言的語義?

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    計(jì)算機(jī)中語言語義的表示之前是采用一些知識(shí)庫的規(guī)則;到了深度學(xué)習(xí)中,則采用分布式的表示方法。下面可以看一個(gè)圖像的案例:

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于語言語義表示及其案例的具體講解,請(qǐng)回看視頻 00:09:00 處)

    這里就要引出在自然語言處理中非常重要的概念——詞嵌入(Word Embeddings),這個(gè)概念從 2013 年開始逐漸火熱起來。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于詞嵌入的具體講解,請(qǐng)回看視頻 00:10:40 處)

    詞表示之后,就要考慮句子表示,不過句子表示的難度遠(yuǎn)大于詞表示,這里主要講一下在神經(jīng)網(wǎng)絡(luò)中怎樣表示句子。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于神經(jīng)網(wǎng)絡(luò)中的句子表示的具體講解,請(qǐng)回看視頻 00:12:42)

    在得到字、句子表示之后,如果要對(duì)自然語言處理任務(wù)的類型進(jìn)行總結(jié),可以劃分為以下幾個(gè)類別:

    • 第一,類型(對(duì)象)到序列,包括文本生成、圖像描述生成任務(wù);

    • 第二,序列到類別,包括文本分類、情感分析任務(wù);

    • 第三,同步的序列到序列,包括中文分析、詞性標(biāo)注、語義角色標(biāo)注任務(wù);

    • 第四,異步的序列到序列,包括機(jī)器翻譯、自動(dòng)摘要、對(duì)話系統(tǒng)任務(wù)。

    深度學(xué)習(xí)在自然語言處理中的困境

    相比計(jì)算機(jī)視覺,深度學(xué)習(xí)在自然語言處理中存在較大的困境。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    針對(duì)這些困境,目前有兩套相對(duì)有效的解決思路:

    一是無監(jiān)督預(yù)訓(xùn)練;

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    二是多任務(wù)學(xué)習(xí)。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    那么為什么多任務(wù)學(xué)習(xí)在自然語言處理中的表現(xiàn)這么好?原因包括:

    • 隱式的數(shù)據(jù)增強(qiáng);

    • 更自然的表示學(xué)習(xí);

    • 更好地表示學(xué)習(xí),一個(gè)好的表示需要能夠提高多個(gè)任務(wù)的性能;

    • 正則化:共享參數(shù)在一定程度上弱化了網(wǎng)絡(luò)能力,可以防止過擬合;

    • Eavesdropping(竊聽)。

    (對(duì)于深度學(xué)習(xí)在自然語言處理中所存在困境及其原因和解決方法——無監(jiān)督學(xué)習(xí)和多任務(wù)學(xué)習(xí)的具體講解,請(qǐng)回看視頻 00:13:51 處)

    自然語言處理中的多任務(wù)學(xué)習(xí)

    下面講一下自然語言下的多任務(wù)學(xué)習(xí)。理想狀態(tài)下,自然語言處理是按照輸入到詞法分析到句法分析再到多任務(wù)的過程,而多任務(wù)的自然語言處理,可以使用一個(gè)共享模塊,同時(shí)進(jìn)行詞法分析、句法分析以及任務(wù)這幾項(xiàng)任務(wù)。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    自然語言中的多任務(wù)學(xué)習(xí)可以歸納為以下幾個(gè)種類:

    • 第一個(gè)是跨領(lǐng)域(Multi-Doman)任務(wù)

    • 第二個(gè)是多級(jí)(Multi-Level)任務(wù)

    • 第三個(gè)是多語言(Multi-Linguistic)任務(wù)

    • 第四個(gè)是多模態(tài)(Multi-Modality)任務(wù)

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    深度學(xué)習(xí)下的多任務(wù)學(xué)習(xí),一般是共享一些多層次的神經(jīng)網(wǎng)絡(luò),可以總結(jié)為以下三種方式:

    • 第一,硬共享模式

    • 第二,軟共享模式

    • 第三,共享-私有模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于自然語言處理中的多任務(wù)學(xué)習(xí)種類以及深度學(xué)習(xí)下的多任務(wù)學(xué)習(xí)方式的具體講解,請(qǐng)回看視頻 00:23:15 處)

    共享模式主要可以分為以下類別:

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    接下來我將以實(shí)驗(yàn)室的論文為主,外加一些相關(guān)論文,介紹一下這些共享模式:

    • 硬共享模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 軟共享模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 共享-私有模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 函數(shù)共享模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 多級(jí)共享模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 主輔任務(wù)模式

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    接著講一下共享模式探索:

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    (關(guān)于對(duì)這幾類共享模式的案例介紹以及共享模式探索的具體講解,請(qǐng)回看視頻 00:26:35 處)

    新的多任務(wù)基準(zhǔn)平臺(tái)

    接下來介紹一下多任務(wù)學(xué)習(xí)的兩個(gè)比較主流的 benchmark。

    先講一下從去年開始比較火的閱讀理解,即機(jī)器閱讀一篇或多篇文檔,并回答一些相關(guān)問題。它對(duì)于自然語言處理來說,是比較難的任務(wù)類型,這就引出了兩個(gè) benchmark。

    • 第一個(gè)是 decanlp,它將很多 Q1 任務(wù)合并在一起作為多任務(wù)學(xué)習(xí)的聯(lián)合訓(xùn)練集,每個(gè)任務(wù)有不同評(píng)價(jià)指標(biāo),每個(gè)任務(wù)的類型差異也很大,有的是翻譯,有的是摘要。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    • 第二個(gè)是最近被大家刷爆的數(shù)據(jù)集 GLUE,它是 NYU 做的,跟 decanlp 理念差不多,也是跟 Q&A、情感分類類似的數(shù)據(jù)集。

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    這兩個(gè)數(shù)據(jù)集還有很多發(fā)展的空間,但是我個(gè)人感覺最近大家刷榜的方式有點(diǎn)走偏了。

    (關(guān)于這兩個(gè) benchmark 的具體講解以及講者的一些思考分享,請(qǐng)回看視頻 00:46:50 處)

    以上就是本期嘉賓的全部分享內(nèi)容。更多公開課視頻請(qǐng)到雷鋒網(wǎng) AI 研習(xí)社社區(qū)(http://ai.yanxishe.com/)觀看。關(guān)注微信公眾號(hào):AI 研習(xí)社(okweiwu),可獲取最新公開課直播時(shí)間預(yù)告。

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    復(fù)旦大學(xué)陳俊坤:自然語言處理中的多任務(wù)學(xué)習(xí) | AI 研習(xí)社職播間第 6 期

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請(qǐng)?zhí)顚懮暾?qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說