騰訊知文團隊 3 篇 IJCAI 2018 一作長文解讀

本文作者：奕欣

2018-04-20 10:15

專題：IJCAI 2018

導語：在今年的 IJCAI-ECAI 2018 上，騰訊知文團隊有 3 篇一作長文被錄取。

騰訊知文團隊

+15

AI影響因子

論文

名稱：IJCAI

時間：2018

企業：騰訊

雷鋒網 AI 科技評論按：本文經微信公眾號“騰訊知文”授權轉載。

備受關注的人工智能領域頂級國際會議 IJCAI，2018 年將于 7 月 13 日至 19 日在瑞典斯德哥爾摩舉行。IJCAI-ECAI 2018, the27th International Joint Conference on Artificial Intelligence and the 23rd European Conference on Artificial Intelligence 是國際 AI 領域研究內容最為全面、最具影響力的頂級學術會議之一。在近日揭曉 2018 年收錄論文名單中，騰訊知文團隊有 3 篇一作長文被錄取，我們將對文章進行簡要解讀，歡迎交流討論。

騰訊知文團隊介紹

騰訊知文團隊 3 篇 IJCAI 2018 一作長文解讀

騰訊知文是 SNG 數據中心的 NLP 團隊，目前專注于問答與對話領域，服務與支持的產品包括騰訊云小微機器人、騰訊云金融智能客服、騰訊云內容理解等。基于語義分析、知識計算、機器閱讀理解等技術，知文團隊在語言智能的求知之路持續探索，同時通過騰訊云提供專業的產品與服務，為更多的業務實踐賦能 AI。知文致力于打造業界下一代智能問答平臺，深度融合 KBQA、DocQA、TaskQA 等多種問答模式。問答是搜索的進化形式，加入我們，加入 1998 年的 Google。

騰訊知文團隊 3 篇入選長文解讀

1.PLASTIC：基于生成對抗網絡調節推薦系統里全局和局部信息的互補性

PLASTIC: PrioritizeLong and Short-term Information in Top-n Recommendation using AdversarialTraining

本文由騰訊知文團隊與中科院深圳先進技術研究院等高校聯合完成。傳統的基于協同過濾的推薦系統是認為用戶偏好和電影屬性都是靜態的，但他們實質是隨著用時間的推移而緩慢變化的。例如，一個電影的受歡迎程度可能由外部事件（如獲得奧斯卡獎）所改變。另一方面，隨著深度學習應用的爆發式發展，基于深度學習的推薦系統越來越引發大家的關注。循環神經網絡（RNN）理論上能夠有效地對用戶偏好和物品屬性的動態性進行建模，基于當前的趨勢，預測來的行為。為了有效地利用傳統協同過濾推薦技術（i.e., 矩陣分解）和深度學習方法（i.e., 循環神經網絡）各自的優點，捕獲用戶和電影之間的長期（全局）和短期（局部）關聯，本文主要研究和探索基于生成對抗網絡（GAN）調節矩陣分解（Matrix Factorization, MF）和循環神經網絡（RNN）在推薦系統上的互補性。

2. 基于主題模型和強化學習的文本摘要

A ReinforcedTopic-Aware Convolutional Sequence-to-Sequence Model for Abstractive TextSummarization

本文由騰訊知文團隊與蘇黎世聯邦理工學院（ETH）、美國哥倫比亞大學、騰訊 AI lab 聯合完成。自動文本摘要方法一般有兩種類型，分別為提取式和總結式。提取式方法通過選擇重要的文本片段來生成摘要，更具可讀性。總結式方法需要先「理解」文檔，然后再組織并生成文本摘要，更靈活，目前更受關注，但可控制性和相關性有所欠缺。另一方面，近年來廣泛應用的傳統基于 RNN 的文本摘要模型存在 exposure bias 和難以并行化的問題。針對以上問題，該研究工作提出一種基于卷積神經網絡的總結式文本摘要生成方法，并結合主題模型的注意力機制，利用強化學習方法進行優化。卷積神經網絡具有可并行化的特點，可以提高訓練速度。這是首次將基于主題模型的注意力機制引入自動文本摘要的生成，可以提高摘要結果的信息相關性和多樣性。另一方面，self-critical 強化學習方法的引入使模型可以針對摘要的評價指標進行優化，緩解訓練和預測過程的 exposure bias。

3. 基于多任務學習的圖像描述自動生成

A Multi-task LearningApproach for Image Captioning

本文由騰訊知文團隊與中科院深圳先進技術研究院、豐田工業大學芝加哥分校（TTIC）等高校聯合完成。傳統的基于編解碼器的圖像描述任務沒有識別和定位多物體的能力，生成的文本經常遇到語言學問題，比如缺少成分、語法錯誤和論點矛盾等。特別是語言學問題，目前的測量方法是無法給出公正評價的。例如，「a group of people standing next to a.「和「agroup of people standing next a fire truck.」兩個句子各項指標的分數差異不顯著，但前者缺少名詞性補語，讓讀者難以理解。本文采用多任務學習方法共享編解碼器，同時提升編碼器對物體的識別能力，以及減少解碼器在生成文本過程中出現的語法錯誤。從離線、線上榜單和人工評測的結果來看，本文提出的方法有不錯的性能表現。

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

1人收藏

專題

IJCAI 2018

本專題其他文章

奕欣

初心者

掃描關注作者微信

發私信

當月熱門文章