6
| 本文作者: 訾竣喆 | 2015-11-13 11:21 |
【編者按】本文編譯自medium,原文作者Arik Sosman。
圖靈測(cè)試一詞來(lái)源于計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)艾倫·麥席森·圖靈寫(xiě)于1950年的一篇論文《計(jì)算機(jī)器與智能》。阿蘭·麥席森·圖靈在1950年設(shè)計(jì)出這個(gè)測(cè)試,其內(nèi)容是,如果電腦能在5分鐘內(nèi)回答出由人類(lèi)測(cè)試者提出的一系列問(wèn)題,且其超過(guò)30%的回答讓測(cè)試者誤認(rèn)為是人類(lèi)所答,則電腦通過(guò)測(cè)試。
Facebook最近推出了突破性的AI系統(tǒng)“M”的Beta測(cè)試版。據(jù)稱(chēng)其性能遠(yuǎn)遠(yuǎn)超過(guò)了其他任何AI。舉個(gè)很簡(jiǎn)單的例子,其他的AI有些可能能夠在用戶(hù)旅行出發(fā)前,捉襟見(jiàn)肘的告訴用戶(hù)當(dāng)前時(shí)間下的多個(gè)位置的天氣情況(上帝保佑你能夠旅途順利);而M則不然,M能夠通過(guò)計(jì)算預(yù)測(cè)出你在什么時(shí)間會(huì)經(jīng)過(guò)什么地方,并以此為據(jù)來(lái)告知你路程中各個(gè)位置的天氣情況,并且還能夠便捷的根據(jù)交通擁堵程度為用戶(hù)計(jì)算出需要在哪個(gè)位置進(jìn)入加油站加油并加以溫馨提示,而且還能夠?yàn)橛脩?hù)推薦目的地附近的食宿和娛樂(lè)場(chǎng)所。
有很多人說(shuō),M的人工智能是虛假的,背后其實(shí)是有人工輔助來(lái)完成的。但是,本文的重點(diǎn)并不是去揭露M的背后有真人操控,而是嘗試去通過(guò)常規(guī)的方式來(lái)證明這一點(diǎn)。

當(dāng)我與M交流的時(shí)候,它在信息中堅(jiān)稱(chēng)自己只是AI。然而,M的回復(fù)并不是瞬時(shí)的,它能夠游刃有余地應(yīng)對(duì)完全無(wú)限制的極其復(fù)雜的測(cè)試這一點(diǎn)的確值得可疑。它是否是名副其實(shí)的AI便因此成為了人們熱議的話(huà)題。看起來(lái)似乎并沒(méi)有常規(guī)辦法能夠證明這個(gè)事情。
圖靈測(cè)試其實(shí)是一種“模仿游戲”。測(cè)試時(shí),測(cè)試人與被測(cè)試人是分開(kāi)的,測(cè)試人只能通過(guò)一些裝置(如鍵盤(pán))來(lái)向被測(cè)試人問(wèn)一些問(wèn)題,隨便問(wèn)什么問(wèn)題都是可以的。在問(wèn)完問(wèn)題之后,如果測(cè)試人能夠正確地分辨出誰(shuí)是人誰(shuí)是機(jī)器,那機(jī)器就沒(méi)有通過(guò)圖靈測(cè)試;而相反的,如果測(cè)試人沒(méi)有分出誰(shuí)是機(jī)器誰(shuí)是人,那這個(gè)機(jī)器就是具備出色人類(lèi)智能的機(jī)器。目前而言,計(jì)算機(jī)的智力與人類(lèi)相比還差得遠(yuǎn)。

有趣的是,與試圖證明M是否是一個(gè)名副其實(shí)的AI所恰恰相反的是:其他AI都想方設(shè)法假裝自己是人類(lèi),而M則一再?gòu)?qiáng)調(diào)自己是人工智能。因此,我們將要進(jìn)行的測(cè)試的是:M是否是人類(lèi)偽裝成的AI。而這種測(cè)試跟圖靈測(cè)試相比似乎要更難加以判定,因?yàn)槿巳绻胍傺b成一個(gè)AI的話(huà),似乎與一個(gè)AI假裝成一個(gè)人相比要簡(jiǎn)單得多。在這種情況下,圖靈測(cè)試是沒(méi)有意義的,因?yàn)镸的目標(biāo)恰恰是不想通過(guò)圖靈測(cè)試。因此,我們希望證明的不是人工智能的局限性,而是其背后的(所謂的)真·人類(lèi)智能的無(wú)限性。因此,我們所需要的是一個(gè)與圖靈測(cè)試不同的測(cè)試——“反圖靈”測(cè)試。
幸運(yùn)的是,我最終找到了證明M的本性的方式。但是首先我要說(shuō)明的是,我想要講好這個(gè)故事,所以在實(shí)驗(yàn)之初我是沒(méi)有定論的。而在進(jìn)行過(guò)程之中,我也一直保持著疑問(wèn)的態(tài)度。直到飾演的最后,我才獲得了一個(gè)明確的答案——M是有人工輔助的。
在我第一次與M進(jìn)行交流的時(shí)候,我們的談話(huà)是這樣開(kāi)始的:

“我使用的是人工智能,但人們幫助訓(xùn)練我。”這是M的關(guān)于其定性的回復(fù)。如果我們細(xì)細(xì)品味這句話(huà)的話(huà),就能發(fā)現(xiàn)這其中可能意味著許多事情——因?yàn)椤拔沂褂玫氖侨斯ぶ悄堋焙汀拔沂且粋€(gè)完全獨(dú)立的AI”并不是一個(gè)意思。所以我不停地盤(pán)問(wèn)它有關(guān)它自己本身的定性問(wèn)題。

有些人認(rèn)為,M所指的是,它作為AI其實(shí)背后是有人打字輸入來(lái)進(jìn)行答復(fù)的,但可以幫助他們做到這一點(diǎn)就需要基于機(jī)器學(xué)習(xí)技術(shù)。然而,從這段對(duì)話(huà)來(lái)看似乎已經(jīng)可以證明,直接問(wèn)M無(wú)法再取得任何更多的信息。

M關(guān)于其定性的自信是一成不變的。不過(guò),在M所說(shuō)的話(huà)中還是有一些語(yǔ)句明顯違背了這個(gè)聊天機(jī)器人的根本定性。為了測(cè)試它的極限,我已經(jīng)要求它來(lái)執(zhí)行一系列復(fù)雜的任務(wù),這是一些其他的AI不可能應(yīng)對(duì)得了的任務(wù)。

之后,我告訴了它我工作的地方,然后稍微修改了我的要求。

是的,它真的回應(yīng)了。

該答復(fù)的最值得注意的地方是:“根據(jù)谷歌地圖顯示”,這表明也許,只是也許,一個(gè)人正在趕時(shí)間鍵入這條回復(fù)。事實(shí)上,即使有一些其他的要求,它的回復(fù)也已經(jīng)被證明并不是那樣的無(wú)懈可擊,無(wú)法和Siri相比。舉例來(lái)說(shuō),當(dāng)我跟它說(shuō),讓它幫我從伯克利分校體育館找一些漂亮的壁紙來(lái),并且跟它要求這些壁紙要畫(huà)有夜間的海灣地區(qū),上面最好還要有海灣大橋、泛美金字塔和薩瑟塔時(shí),M雖然確實(shí)為我找到了一些非常精美的壁紙,但它說(shuō)它無(wú)法找到任何鐘塔。作為安慰,它說(shuō)如果發(fā)現(xiàn)有更加精確的符合我的標(biāo)準(zhǔn)的壁紙將會(huì)及時(shí)通知我。

現(xiàn)在,隨著上述反應(yīng)的所產(chǎn)生的第一個(gè)問(wèn)題是,它發(fā)過(guò)來(lái)的壁紙確實(shí)有泛美金字塔,M知道這些壁紙符合該條件。但這些壁紙所沒(méi)有的是薩瑟塔,那么為什么M說(shuō)如果找到有著泛美金字塔的壁紙時(shí)會(huì)來(lái)通知我呢?
第二個(gè)問(wèn)題是,它被稱(chēng)為“Transamerica Pyramid”,而不是“Transamerican Pyramid”。請(qǐng)注意在這張截圖中,M的回復(fù)里出現(xiàn)了兩個(gè)“with”,還出現(xiàn)了“I'l”。它已經(jīng)出現(xiàn)了兩個(gè)錯(cuò)別字!事實(shí)上,這并不是唯一一次出現(xiàn)這種計(jì)算機(jī)不可能出現(xiàn)的錯(cuò)誤。
盡管很多人都不會(huì)去區(qū)分“its”和“it’s”之間的區(qū)別,但這對(duì)于A(yíng)I而言不應(yīng)該是一個(gè)問(wèn)題。話(huà)雖如此,但也有可能它在被訓(xùn)練的時(shí)候就已經(jīng)存在這種語(yǔ)法錯(cuò)誤了,所以這些失誤并不足以下定論。即使我前面提到的響應(yīng)延遲的情況可能是故意的,即使當(dāng)M準(zhǔn)備回應(yīng)的時(shí)候出現(xiàn)了輸入指示器,而不是作為一個(gè)普通的AI所應(yīng)該做的——立即發(fā)送整個(gè)字符串。
這個(gè)結(jié)果并沒(méi)有滿(mǎn)足我,所以我仍然在尋找一種新的方式來(lái)證明M的背后的確有真人來(lái)輔助。我怎么才能讓他們無(wú)所遁形呢?
碰巧的是,當(dāng)答案主動(dòng)送上門(mén)來(lái)的時(shí)候,我卻并沒(méi)有抓住它。我有一次在Cupertino的電影院看電影,電影結(jié)束得比較晚,我問(wèn)M周?chē)欠裼腥栽跔I(yíng)業(yè)中的能夠讓我吃夜宵的地方。當(dāng)時(shí)只有兩個(gè)地方還開(kāi)著門(mén),但我不知道他們的廚房是否仍然有人能夠做飯。而在我問(wèn)M能否給他們打電話(huà)來(lái)獲知到底能不能吃夜宵時(shí),它說(shuō),它可以。
于是我便繼續(xù)追問(wèn)M能否給我的朋友打電話(huà)時(shí),它說(shuō)無(wú)法完成該請(qǐng)求。問(wèn)它能否可以打電話(huà)給我自己時(shí),它還是說(shuō)無(wú)法完成請(qǐng)求。顯然,這個(gè)功能只能用于呼叫企業(yè),而不是個(gè)人。所以,我該怎么辦?我想了一會(huì)兒,自己編造了一個(gè)故事,并要求M撥通這個(gè)電話(huà)。

于是M問(wèn)我要電話(huà)號(hào)碼,我干脆地把我的電話(huà)號(hào)碼給了它。大約過(guò)了五分鐘后,我收到了沒(méi)有來(lái)電顯示的電話(huà)。當(dāng)我接通后,聽(tīng)到了電話(huà)的另一邊有隆隆的噪音,對(duì)方說(shuō)了一句“你好”后就掛斷了電話(huà)。緊接著,以下的對(duì)話(huà)就產(chǎn)生了。

不幸的是,我并沒(méi)有固定電話(huà)號(hào)碼,這讓我有點(diǎn)失望。我就這樣與可以證明M的性質(zhì)的機(jī)會(huì)失之交臂了!
幾天后,我因?yàn)橐恍┰虿坏貌辉谥苣┗氐焦炯影喙ぷ鳌6氐睫k公室后,我才意識(shí)到,公司里就有一個(gè)固定電話(huà)啊。再來(lái)試驗(yàn)一遍這個(gè)實(shí)驗(yàn)!

大約三分鐘后,我接到了一個(gè)會(huì)議室打來(lái)的電話(huà)。當(dāng)我拿起手機(jī),一個(gè)獨(dú)特的女性聲音說(shuō)道:“喂?”碰巧的是,我不小心在之前將手機(jī)設(shè)置為了靜音,所以她沒(méi)聽(tīng)見(jiàn)我說(shuō)公司名稱(chēng)。盡管如此,這肯定是人類(lèi)的聲音毋庸置疑。我將整個(gè)過(guò)程做了一個(gè)記錄。
緊接著,M發(fā)送了一個(gè)答復(fù)。

更重要的是,在我看來(lái),他們似乎忘了屏蔽掉該特定呼叫主叫方的ID,因?yàn)槲铱吹搅怂麄儞苓^(guò)來(lái)的電話(huà)號(hào)碼。

所以,現(xiàn)在似乎已經(jīng)可以證明:M會(huì)從+1(650)796-2402處調(diào)用人工輔助回復(fù)。正如大家看到的照片顯示,自動(dòng)反向查找匹配該號(hào)碼到了Facebook。因此,我們終于完成了實(shí)驗(yàn)。我們有明確的證據(jù),證明M背后的確有人工輔助的成分。那么,接下來(lái)的問(wèn)題就是:M是完全由人類(lèi)來(lái)操控的呢,還是說(shuō)還是有一些人工智能驅(qū)動(dòng)組件在其中的呢?對(duì)于這個(gè)問(wèn)題,我想把它作為一個(gè)家庭作業(yè),讓讀者去弄清楚。在此期間,我會(huì)充分享受M這個(gè)近乎萬(wàn)能的個(gè)人助手帶給我的樂(lè)趣。
相關(guān)閱讀:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。