0
互聯網時代,人們每天都會通過網絡獲取大量信息。微信、微博、各種新聞客戶端......我們不僅在這些 APP 上瀏覽新聞,有時也會發表自己的見解。
作為最受歡迎的社交應用之一,微博是很多人獲取信息的重要渠道,很多用戶每天在上面發表大量言論。通常情況下,這些言論分為兩類,一類是對客觀事件的描述,另一類是主觀性描述。主觀性文本帶有作者的喜好、厭惡等情感傾向。
微博上的大量用戶積累豐富的語料數據。近年來,隨著自然語言處理技術的發展,利用海量的微博數據進行情感分析已成為一項重要的研究課題。
情感分析技術
情感分析(Sentiment Analysis)的研究始于 2003 年 Nasukawa 和 Yi 兩位學者關于商品評論的論文,其目標是從文本中分析出人們對于實體及其屬性所表達的情感傾向以及觀點,帶有強烈的個人主觀因素。
作為自然語言處理的子任務,根據處理文本粒度的不同,情感分析可以分為篇章級、句子級、詞語級 3 個研究層次:
篇章級:獲取整個文檔或者段落的情感。篇章級的情感分析有一個前提假設,那就是全篇所表達的觀點僅針對一個單獨的實體,且只包含一個觀點持有者的觀點。
句子級:獲得單個句子的情緒。句子級分析與篇章級存在同樣的前提假設,也就是說一個句子只表達了一個觀點和一種情感,并且只有一個觀點持有人。
詞語級:獲得句子中,詞語表達的情感。在實際的語言表達中,一個句子中可能包含了多個不同情感傾向的觀點,此時就需要進行詞語級分析。
情感分析有多種類型和風格,范圍從專注于極性(正面,負面,中立)到檢測情感和情緒(憤怒,快樂,悲傷等)或識別意圖(感興趣、不感興趣)。
據估計,世界上 80% 的數據都是非結構化的,沒有以預先定義的方式組織。 其中,大部分數據來自文本數據,如電子郵件、社交媒體、調查、文檔等。 這些文本通常難以分析、理解和分類。通過情感分析技術,可以自動處理這些數據,提高團隊效率。因此,情感分析技術有著重要的研究價值。
情感分析應用廣泛。在商品零售領域,通過對海量用戶的評價進行情感分析,可以了解用戶訴求,及時進行反饋和改進;在輿情領域,分析人們對熱點事件的點評,有助于掌握輿論走向;在金融領域,對交易者對于股票等產品的態度進行情感分析,可以為交易行情提供參考。
微博立場檢測大賽
立場檢測是情感分析技術的熱門方向之一。近年來,微博立場檢測作為一個有著極大研究價值的新興課題,引起了廣泛的關注。為了幫助同學們提高自己,近日,AI 研習社微博立場檢測挑戰賽上線啦!
比賽簡介
本次微博立場檢測挑戰賽為單人賽,比賽時間為 3 月 13日—4 月 12 日。
比賽網址:https://god.yanxishe.com/44
參賽者的任務是判斷微博作者對某個話題是持何種立場。也就是說,參賽者需要對微博作者的立場進行分類,共有 3 種立場:FAVOR 支持,AGAINST 反對,NONE 兩者都不是。

數據集
比賽數據集下載鏈接:https://static.leiphone.com/wb.zip
結果文件如下所示:

第一個字段位:測試集 ID(注意 ID 從 0 開始)
第二個字段:立場類別(FAVOR、AGAINST、NONE)
結果文件建議使用 UTF-8(BOM)編碼。
評分標準&獎金
AI 研習社將會對比選手提交的 csv 文件,確認正確識別樣本數。
True:模型分類正確數量
Total :測試集樣本總數量

本次比賽共設置 3 種獎項,獎金池 3000 元。獎金將在比賽后提現時發放到微信零錢。
參與獎(Participation Award)
金額:占總獎金的 30%
獲獎人數:所有人(每人僅能獲得一次參與獎)
獲獎條件:提交結果大于標準分,標準分=60
突破獎(Prizes)
金額:占總獎金 20%
獲獎人數:所有人
排名獎(Ranking Award)
金額:占總獎金 50%
獲獎人數:得分前 5 名
特別提醒:3 種獎項可以同時帶回家!越早提交,突破分數越大,獎金越多哦~
獲取更多信息,可以添加慕慕微信號:AIMOOC-XM,或者掃下面的二維碼:

再次敲黑板:報名網址是 https://god.yanxishe.com/44 。快來報名吧!
雷鋒網雷鋒網雷鋒網
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。