1
| 本文作者: 思睿 | 2015-07-14 15:54 |

在最近幾個月的時間里,人工智能的表現上已經取得了巨大的進步,尤其是那些被認為是電腦幾乎不可能完成的事情,例如:面部和物體的識別。但也有一些領域,對機器而言仍然難以去掌握,比如幽默。幽默感是一種獨特的個性,而且幽默感本身也難以界定。
部分原因是,幽默取決于許多內心因素,并且可能隨著時間的變化而發生改變。有些現在看來可笑的事情,可能在晚些時候或明天就似乎并不那么好笑了。
然而,很多語言學家和心理學家認為,好的笑話都有著共同的屬性,通過系統性的分析應該能夠揭示出來。現在的問題是如何處理這些幽默的話語,以及機器學習是否能有所幫助。
如今,得益于密歇根大學的 Dragomir Radev 和在雅虎實驗室、哥倫比亞大學,以及《紐約客》雜志的共同努力,我們得到了一個答案。這些研究人員一直在研究與漫畫相關的說明文字(旁白、對話和字幕)。
《紐約客》每星期都會出版一部沒有任何說明文字的漫畫,并允許讀者提交自己的內容。之后《紐約客》的編輯會挑選出前三名,并要求讀者投票選出最佳。
此舉創造了一個巨大的說明文字數據庫。如今,Radev 和其合作伙伴發表了他們的研究——研究了自2005年以來,為50部《紐約客》 動畫而編寫的30萬種說明文字。
他們的方法很簡單。首先使用多種標準語言技巧,分析了所有為同一部卡通撰寫的說明文字。標準包括了正面或負面的情緒程度,說明文字是否是以人類為中心(即是否參照了個人),以及他們是如何明確提及在漫畫中所描繪的物體等等。
Radev 和其合作伙伴也利用了網絡理論來研究這些文字。他們列出了每段文字中所提到的主題,然后通過連接那些提到了相同主題的文字來創建網絡。這可以讓他們使用標準的網絡分析工具發現網絡中最重要的節點,即核心屬性。
每種方法都能產生一個說明文字的排名。Radev 和其合作伙伴會把每個排名最高的說明文字,和他們的“黃金法則”進行對比:也就是《紐約客》讀者所選出來的最有趣的說明文字。
Radev 表示,研究結果提供了一些對有趣的理解。“我們發現這些方法一致認為,符合帶有負面情緒、以人為本和詞匯的中心性的這些說明文字更有趣。”
這是一個奇怪的研究,以至于研究本身的可靠性也難以評估。研究人員承認,在發現負面情緒與有趣的相關性方面一點都不驚喜;以人為本也是幽默中能夠預期到的特性。
很容易想象,這項研究的目標之一,就是為《紐約客》每周一期的漫畫,制作能從成千上萬的內容中自動選擇最佳說明文字的機器。如果可以,還能讓機器寫出更好的漫畫說明文字,也許會全程自動化。
但我們以后可以讓計算機講笑話了嗎?研究中并沒有那么明確,可以想見短期內并不會這樣。
via technologyreview
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。