直播預告 | 第三期CCF-NLP走進高校之“走進河北科技大學”

本文作者： AI科技評論

2020-11-05 17:07

導語：大家關注已久的“CCF-NLP走進高校”系列高校NLP研究分享報告會第三期，11月8日 18:30-21:35精彩繼續！

大家關注已久的“CCF-NLP走進高校”系列高校NLP研究分享報告會第三期，11月8日 18:30-21:35精彩繼續！

為了促進更多師生對自然語言處理前沿進展的了解，幫助在校計算機及相關專業大學生成長和發展，CCF-NLP致力于讓領域內的權威大牛們走進更多的高校，與師生進行溝通和交流。自然語言處理專委會為此將舉辦一系列 CCF-NLP走進高校系列活動。

在“CCF-NLP走進高校”前兩期：走進“華南理工大學”和走進“鄭州大學”的分享會上，專家們圍繞自然語言處理做了精彩報告，在AI研習社、Bilibili等平臺上觀看超過8萬人次，報告會反響熱烈。

往期活動回顧請見以下網頁

CCF-NLP走進華南理工大學：https://www.yanxishe.com/blogDetail/20930

CCF-NLP走進鄭州大學：https://www.yanxishe.com/blogDetail/21430

11月8日“CCF-NLP走進高校”第三期將走進美麗的“河北科技大學”，為同學們帶來NLP領域最前沿的研究成果和未來發展趨勢。本次活動邀請到三位NLP領域的資深權威學者，分別是：

· 南京大學計算機科學與技術系副教授-黃書劍

· 浙江大學計算機學院副教授-趙洲

· 西湖大學特聘研究員-張岳

嘉賓們將圍繞機器翻譯中的注意力機制及其控制、非自回歸多模態翻譯、對話系統的兩個挑戰三大主題展開分享，為同學們接觸NLP前沿資訊提供新穎的解讀視角。

本期活動由中國計算機學會自然語言處理專業委員會（CCF-NLP）主辦，河北科技大學、AI研習社聯合承辦，AI科技評論和機器學習算法與自然語言處理作為戰略媒體，活動將結合線上直播分享和河北科技大學線下分享方式舉行。

直播觀看地址

AI研習社直播地址：https://www.yanxishe.com/events/ccf-nlp-hdu

B站直播地址：http://live.bilibili.com/22494831

活動流程

01 / 開場介紹

嘉賓：萬小軍

時間：18：30--18：45

02 / 河北科技大學介紹

嘉賓：張冬雯

時間：18：45--19：00

03 / 分享主題：機器翻譯中的注意力機制及其控制

演講嘉賓：黃書劍

時間：19：00--19：50

分享環節：40分鐘主題分享+10分鐘互動問答

演講摘要：

深度學習方法在機器翻譯和自然語言處理中取得了巨大的成功。注意力機制通過參數的自動學習進行有選擇的信息獲取，在復雜任務的學習過程中起到了非常重要的作用。本次報告簡單介紹注意力機制，以及本實驗室三個與注意力機制相關的工作，分別關注于注意力機制和位置建模的關系、多注意力頭控制對翻譯的影響以及篇章機器翻譯中的注意力。相關論文發表于ACM/IEEE TASLP、AAAI2020和IJCAI2020上。

04 /分享主題：非自回歸多模態翻譯

演講嘉賓：趙洲

時間：19：50--20：40

分享環節：40分鐘主題分享+10分鐘互動問答

演講摘要:

多模態翻譯任務是指在不同模態的數據（包括文本、語音、圖像或視頻等）之間進行互相轉化的任務，例如：語音合成、語音識別和唇語識別等，它們旨在通過機器學習或深度學習的方法理解源模態信息并生成目標模態數據。當前，多模態翻譯具有以下挑戰：1、不同模態數據之間通常具有語意（信息量）差異，例如：在語音合成中，語音比文本包含更多的韻律和情感信息，而在唇語識別中，文本比視頻包含更明確和清晰的語音信息，這使得多模態翻譯模型具有預測和填補缺失的信息的能力；2、不同模態數據之間通常具有長度差異，例如：語音和視頻的序列通常會比文本長得多，因此多模態翻譯模型需要解決數據之間長度不匹配問題，并找到其中的映射關系。針對以上挑戰，最近的工作提出了一些較為有效的解決思路：基于編碼器-解碼器的序列生成自回歸模型、基于時長預測模型和脈沖神經網絡的非自回歸架構均可以較好地預測和填補缺失的信息，并解決長度不匹配問題。本報告將首先介紹當今主流的多模態翻譯任務，然后介紹幾個具有啟發意義的多模態翻譯工作，最后對未來可能的研究方向進行思考與展望。

05 / 分享主題：對話系統的兩個挑戰

演講嘉賓：張岳

時間：20：40--21：30

分享環節：40分鐘主題分享+10分鐘互動問答

演講摘要：

對話系統是自然語言處理的重要應用之一，近兩年隨著深度學習技術的進步而受到越來越多關注。然而，實際應用的對話系統，包括閑聊對話和任務對話都面臨著許多尚未解決的挑戰。在這次報告中，我將介紹兩個具體挑戰和實驗室的初步研究。具體而言，對于閑聊對話，社會常識和場景的識別具有重要意義，只有理解對話情境，才能做出有理有據地回答。然而，當前的閑聊對話系統對社會常識少有探討。我們近期和微軟亞洲研究院合作，標注了一套相關數據及，并且對上下文表示進行了初步測試。對于任務對話，當前方法采用端到端的機器學習策略，從手工標注中識別特定領域的對話狀態。然而，世界上應用領域繁多而層出不窮，手工標注過程復雜，質量難以保證。我們嘗試研究利用隱變量深度學習，自動探究客服對話記錄中所隱藏的用戶意圖和對話狀態，對這個挑戰進行了開始嘗試。