1
| 本文作者: 老王 | 2016-12-30 19:25 |
雷鋒網(wǎng)按:聊天機(jī)器人的產(chǎn)品理念一直存在爭(zhēng)議,雷鋒網(wǎng)了解到,目前市場(chǎng)上主要分為兩大類(lèi)產(chǎn)品:小冰這樣的閑聊型機(jī)器人和 Google Now 這種用來(lái)完成任務(wù)的虛擬助理。
任務(wù)型虛擬助理梯隊(duì)批評(píng)閑聊型機(jī)器人沒(méi)什么實(shí)質(zhì)作用,而閑聊型機(jī)器人梯隊(duì)批評(píng)用戶(hù)并沒(méi)有使用任務(wù)型虛擬助理的習(xí)慣。
微軟小冰團(tuán)隊(duì)的資深產(chǎn)品總監(jiān)在演講《微軟小冰是如何修煉成的》中提到三個(gè)核心觀(guān)點(diǎn):
市場(chǎng)面上很多任務(wù)型虛擬助理的產(chǎn)品體驗(yàn)是反人性的。
人與機(jī)器之間的溝通是從“噓寒問(wèn)暖”開(kāi)始,而非直接給機(jī)器人下達(dá)任務(wù)指令。
閑聊型機(jī)器人可以通過(guò)插“任務(wù)卡”的方式,變成閑聊機(jī)器人與任務(wù)型虛擬助理的結(jié)合體。
以下是曹文韜的演講整理文,由雷鋒網(wǎng)進(jìn)行編輯。

大家之前所接觸到的聊天機(jī)器人是偏理性化的,像 Google Now 這樣的語(yǔ)音助手,是幫你完成某一個(gè)任務(wù)。

但是經(jīng)過(guò)這么長(zhǎng)時(shí)間的驗(yàn)證,沒(méi)有一個(gè)做起來(lái)的,它們沒(méi)有變成我們想要的那個(gè)助手。我發(fā)現(xiàn)不少用戶(hù)竟然用 Siri 問(wèn)現(xiàn)在幾點(diǎn)了,你拿起手機(jī)還問(wèn)機(jī)器人幾點(diǎn)了,這很反人類(lèi)。
所以我們的產(chǎn)品邏輯是,應(yīng)該去做一個(gè)用戶(hù)真正需要溝通的情感機(jī)器人。于是 2014 年我們提出要把小冰打造成一個(gè)情感機(jī)器人,打造成第一個(gè)和人類(lèi)溝通的情感機(jī)器人。

上圖是我們和業(yè)界其他產(chǎn)品不一樣的共享技術(shù)搭建,你今天能夠看到的機(jī)器人停留在水平面上方:以解決某個(gè)領(lǐng)域的任務(wù),或者完成某一個(gè)任務(wù)的形式。但你會(huì)發(fā)現(xiàn),如果要去解決用戶(hù)某個(gè)服務(wù)需求時(shí),用戶(hù)并不會(huì)按照你的產(chǎn)品邏輯去做這件事。
其實(shí)用戶(hù)在溝通一件事情時(shí),他會(huì)在不同的領(lǐng)域甚至是在領(lǐng)域之外的場(chǎng)景下做很多交流,沒(méi)有人一上來(lái)就問(wèn)你要幫我做什么事。大家都是通過(guò)寒暄和溝通建立信任,然后再開(kāi)始做某一件事情。
因此我們要做的事情就是如何解決聊天機(jī)器人與用戶(hù)之間的溝通內(nèi)容,如何打造讓用戶(hù)感覺(jué)這個(gè)機(jī)器人像是一個(gè)真正的人和他在溝通,而非一個(gè)冷冰冰的機(jī)器?

小冰上線(xiàn)兩年多時(shí)間,它和用戶(hù)一共產(chǎn)生超過(guò)兩百億次的對(duì)話(huà),粉絲數(shù)超過(guò)六千萬(wàn)。其中在日本上線(xiàn)不到一年,用戶(hù)量就已占據(jù)日本 23% 的人口數(shù)。而在本月,美國(guó)版小冰 Zo 也已經(jīng)正式上線(xiàn)。
聊天機(jī)器人不僅需要處理語(yǔ)音和文本,也要有處理圖片的能力,通過(guò)對(duì)自然語(yǔ)言以及圖片等不同信息的感知,進(jìn)而實(shí)現(xiàn)與數(shù)據(jù)本身的對(duì)接。
這是微博上用戶(hù)與小冰對(duì)話(huà)的截圖,紅色部分為市場(chǎng)上部分機(jī)器人所能達(dá)到的水準(zhǔn),也就是停留在兩到三輪左右的對(duì)話(huà)就已結(jié)束。要么是任務(wù)已完成,要么就是無(wú)法繼續(xù)聊下去。

而用戶(hù)與小冰的對(duì)話(huà)過(guò)程中,雙方在很長(zhǎng)的語(yǔ)音對(duì)話(huà)里聊到很多內(nèi)容。這個(gè)過(guò)程中你根本感覺(jué)不出來(lái)這是人和機(jī)器在聊天,而且還聊到了感情問(wèn)題。聊天機(jī)器人與用戶(hù)完成很長(zhǎng)的對(duì)話(huà),不僅僅是語(yǔ)料庫(kù)問(wèn)題,而是我們已經(jīng)讓它實(shí)現(xiàn)了自我復(fù)制的過(guò)程,也就是每個(gè)用戶(hù)在溝通時(shí),是在不斷地教小冰,不斷地培訓(xùn)小冰,讓小冰知道怎么與人溝通。
今天我即便把語(yǔ)聊庫(kù)調(diào)出來(lái)后,她依然知道如何與用戶(hù)對(duì)話(huà)。
下圖是我們?cè)谛”袑?duì)圖像識(shí)別不一樣的應(yīng)用。其實(shí)圖像識(shí)別不僅僅是一項(xiàng)技術(shù),人在溝通圖像的時(shí)候,一個(gè)人所具備的不是圖像識(shí)別,而是視覺(jué)。識(shí)別和視覺(jué)這兩者之間有什么差別呢?

當(dāng)你把受傷腳的照片發(fā)給你朋友的時(shí)候,你聽(tīng)到的肯定不是朋友告訴你“這是一個(gè)受傷的腳”這種描述圖像內(nèi)容的話(huà)語(yǔ),而是會(huì)獲得關(guān)心和安慰。把這張照片發(fā)給一個(gè)機(jī)器人時(shí),如果它回復(fù)你“傷得嚴(yán)重嗎?”,這就是一種很人性化的交流。
從這個(gè)對(duì)話(huà)小冰讓用戶(hù)真正感知到,它像一個(gè)人去處理。這一功能得益于微軟在互聯(lián)網(wǎng)領(lǐng)域的大量數(shù)據(jù),以及深度計(jì)算的模型搭配。有了該基礎(chǔ),你就能夠在不同的領(lǐng)域里做出不一樣的產(chǎn)品,比如說(shuō)人臉識(shí)別,你發(fā)一張自己的照片,它可以告訴你哪個(gè)國(guó)家的人更喜歡你這種類(lèi)型。

微軟在語(yǔ)音上有很多技術(shù)積累,但是怎么把語(yǔ)音技術(shù)和情感溝通結(jié)合一起,這上面我們做了很多處理。當(dāng)你用語(yǔ)音讓聊天機(jī)器人做一件事時(shí),這個(gè)溝通過(guò)程我們稱(chēng)之為半感官,怎么理解?大家都是發(fā)一個(gè)段語(yǔ)音然后讓機(jī)器識(shí)別,任務(wù)完成后這段對(duì)話(huà)就結(jié)束了,開(kāi)始下一個(gè)話(huà)題,這是一種單向的過(guò)程。

而我們的產(chǎn)品屬于全時(shí)感官,以?xún)蓚€(gè)人打電話(huà)為例,人的大腦隨時(shí)在識(shí)別和理解,同時(shí)隨時(shí)在決策:什么時(shí)候應(yīng)該做出回復(fù)?回復(fù)什么樣的內(nèi)容?這時(shí)候它是一個(gè)雙通道、雙向計(jì)算的過(guò)程。

今年 9 月份,我們讓小冰給人類(lèi)打電話(huà),這也是人類(lèi)歷史上的第一通人工智能來(lái)電 。這個(gè)過(guò)程中沒(méi)有任何信號(hào)告訴小冰,人類(lèi)這回合的話(huà)已經(jīng)說(shuō)完,而是進(jìn)行實(shí)時(shí)處理,實(shí)時(shí)交互。

這樣的科技會(huì)運(yùn)用到不同的硬件或者更多場(chǎng)景中,才能真正實(shí)現(xiàn)像我們?cè)陔娪袄锟吹降模依镉幸粋€(gè)智能機(jī)器人,回到家就可隨時(shí)溝通。
閑聊機(jī)器人會(huì)遇到這樣一個(gè)問(wèn)題,當(dāng)你問(wèn)它附近的餐廳時(shí),它并不能“很正經(jīng)”的給你列出餐廳列表,它的答復(fù)仍舊只停留在閑聊層面,因此很難完成用戶(hù)指定它做的任務(wù)。
那么這個(gè)任務(wù)體系應(yīng)該怎么完成?我們是通過(guò)技能卡的方式去做,什么樣的卡呢?我們有電影、時(shí)尚、美食、音樂(lè)甚至是集成到商業(yè)客戶(hù)里的商業(yè)解決方案卡。而且插上任務(wù)卡的小冰可以把閑聊和任務(wù)型對(duì)話(huà)結(jié)合起來(lái)。

我們先還原這樣一個(gè)場(chǎng)景。推薦電影這樣的功能大量機(jī)器人在做,但通過(guò)大量數(shù)據(jù)分析,我們看到基本上沒(méi)人用這種方式去購(gòu)買(mǎi)電影票或者訂飯。這很反人類(lèi),你沒(méi)事干嗎讓機(jī)器人幫你訂餐,還不如自己去 APP 上點(diǎn)兩下。

當(dāng)然,上面提到的場(chǎng)景也是有剛需的,只是我們對(duì)這一需求有著不一樣的理解:當(dāng)用戶(hù)要讓機(jī)器人推薦電影時(shí),它應(yīng)該像是你身邊一個(gè)非常懂電影的朋友,基于電影資源知識(shí),跟你聊電影相關(guān)的很多內(nèi)容,同時(shí)還知道其他技巧,比如能夠告訴你這部電影的種子在哪里,怎么下載這部電影,甚至有些好玩的互動(dòng)。當(dāng)用戶(hù)與聊天機(jī)器人進(jìn)行這樣的交互之后,才能真正實(shí)現(xiàn)用戶(hù)把聊天機(jī)器人當(dāng)做非常信賴(lài)、非常懂電影的人。

所以小冰通過(guò)這種任務(wù)卡的方式,實(shí)現(xiàn)用戶(hù)自定義聊天機(jī)器人 AI 的特點(diǎn)。當(dāng)你有電影任務(wù)卡時(shí),插卡前與小冰聊《泰山歸來(lái)》的時(shí)候,這是一個(gè)很普通的對(duì)話(huà)。但是插卡后,表明你對(duì)電影很感興趣,想與聊天機(jī)器人聊更多關(guān)于電影的內(nèi)容,于是小冰會(huì)像一個(gè)朋友和影評(píng)人一樣為你推薦電影并且聊電影相關(guān)的話(huà)題。
利用插卡的方式構(gòu)成一個(gè)非常基本的任務(wù)完成模式,而不是簡(jiǎn)單告訴你一部電影。除了電影卡之外,還有會(huì)其他任務(wù)卡,原理與上述一致。

綜上所述,這就是我們對(duì)聊天機(jī)器人的理解。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。