BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

本文作者：叢末

2018-12-09 17:17

導語：作者介紹了BigData 2018最新錄用的一篇可疑行為檢測的論文。思路新穎，方法簡單易懂，讓平臺解開誤判責任帶來的束縛，基于平臺大數據給出可操作的決策建議。

雷鋒網 AI 科技評論按：本文作者趙通，是來自美國圣母大學計算機系 DM2 實驗室的博士生。本文是他為雷鋒網 AI 科技評論撰寫的基于 BigData 錄用論文《Actionable Objective Optimization for Suspicious Behavior Detection on Large Bipartite Graphs》的獨家解讀稿件，未經許可不得轉載。

前言

惡行是可怕的。章瑩穎綁架失蹤案過去了 500 余天，還沒有實質進展。2017 年 4 月，未滿 27 歲的北大碩士畢業生章瑩穎作為訪問學者前往美國伊利諾伊大學香檳分校交流學習。6 月 9 日下午 2 點，章乘坐公交赴校外公寓簽約，在轉站等車時，不慎上了一輛陌生男子的黑色轎車，之后再也沒有人見過她。當晚其好友與教授報警，一直到 6 月 30 日，美國警方拘捕一名白人男子，稱章可能已死亡。7 月 12 日，聯邦大陪審團正式起訴嫌疑人，到目前為止，此案仍在法庭受理當中。類似的情形在國內也時有發生，「滴滴順風車」命案便是血淋淋的悲劇。每每出現在新聞標題里的「又一女孩」或是「三個月內第二名乘客」這些字眼，都讓人納悶，究竟是什么讓這類事件一而再、再而三地發生。惡行不只出現在現實生活中，在網絡中也無處不在，如在淘寶和 eBay 上就存在買家「霸凌」賣家的行為：買家只需購買賣家的一件便宜商品，即獲得給商品評價、打分的權利。買家如若無視商品質量，打出極低的分數，賣家的平均分數就會降低，而平臺推薦系統往往根據評分排行，評分稍微降低一點，都會導致賣家在和其余商家競爭時無法出現在被推薦的第一頁，從而失去生意，最終倒閉。因此買家利用賣家的弱點，可以索要折扣乃至現金等，這就是「霸凌買家」的由來。

引出問題

在關注各種案件的同時，我們不得不思考：當我們面臨即將到來的惡行時，我們是否能夠提前防范惡性事件的發生？越是思考，越是讓人不寒而栗——比起生活上的孤零零，更可怕的是信息的貧瘠與環境的復雜。

父母親的一句「注意安全」遇上了「簽訂租約」、「錯過公交」、「遲到誤點」、「校內路邊」、「黑色轎車」、「白人男子」、「邀請上車」等陌生環境下的復雜情景，都顯得蒼白無力。受害人的判斷力迅速被「準時準點」、「誠實守信」、「文明發達」、「樂于助人」沖垮。如果這些狀況發生在她的家鄉福建省南平市，想必她會冷靜很多：太多的事故、故事以及對周遭的了解讓她擁有足夠多的信息去面對復雜環境。試想，如果瑩穎曾看過伊利諾伊大學校園犯罪地圖、聽過一些危險事件的報道，在內心里構建起一座防范惡行的「防火墻」，她也許會在「簽約誤點」的情況下對「上陌生人的黑色轎車」這一選擇要多加斟酌，從而避免這一悲劇的發生。一句簡單的「注意安全」，信息量真的是太少了。

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖一：來自 CampusCrime.net：性犯罪、搶劫等惡性事件的校園分布

雖然政府與各方平臺已經非常努力地給人民與用戶提供最優質、最安全的服務，他們卻很難提前對惡行做出有效的防范。因為將好人誤判為壞人的代價是巨大的。試想，當重要郵件被誤扔進了垃圾箱，當一批正常的淘寶用戶被封號，當警方誤逮捕「可疑人員」，這些都必會導致服務劣質化、抱怨四起、平臺收益受損、責任難以承擔等諸多負面影響。這就是為什么政府與平臺雖坐擁計算與大數據資源，卻顯得反應遲鈍、畏首畏尾。不過在責難平臺的同時，用戶自身也忽略了安全意識的建立，忘記了自己才是最有執行力去說「不」的人。

我們的想法

當我們觀察到平臺與用戶之間存在著這條很長很深的信息鴻溝時，圣母大學計算機系數據決策實驗室（DM2 Lab, University of Notre Dame）嘗試使用一種新的思路去彌補這一鴻溝。為了統一稱謂，我們稱發出行為的人為「主動方」，包括搭訕者、粉絲、司機等；接受行為的人為「被動方」，包括被搭訕者、被關注者、乘客等，其中「主動方」存在產生惡性行為的可能。傳統的惡行檢測算法（suspicious behavior detection）往往以「主動方是否為攻擊者」的標簽作為優化的變量，從而使得平臺可以對預測為正例者進行人工調查、再做出決策，調查過程費時費力。DM2 提出，讓「被動方」根據對「主動方」的特征或者行為歷史的觀察形成防范意識、選擇防御等級，例如女性乘客可以根據司機年齡性別、駕齡、過往評分和評價等信息進行篩選。這里就存在一個妥協的問題：防御等級過高，則得到服務的范圍和及時性會降低；防御等級過低，則安全又難以得到保證。用戶個體是很難選擇合理等級的，而平臺卻擁有海量數據和智能算法，可以為用戶推薦合適的防御等級并估計選取后的結果，讓用戶自行選擇。這樣用戶擁有安全意識、平臺也可以「推卸」一部分責任，信息鴻溝得以彌補，惡意行為的防范變得可操作、可執行。

事實上，由用戶個體來防范惡行的思路并不是第一次出現，如淘寶就有插件可以用來屏蔽差評師（好評率低于一定百分比的買家）。

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖二：差評師攔截插件

然而，這看似安全的作法，卻也有不小的負面影響。當賣家「防御等級」過高時，很多誠實卻打過低分的買家無法購買商品，導致賣家損失訂單。如下圖中的例子：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖三：好評率為 85% 的誠實買家無法購買此家店的商品

DM2 所提出的 Actionable Objective Optimization (AOO) 算法將被動方的防御等級作為優化變量，將整體的安全系數和服務質量作為優化目標，在最常見的二部圖 (bipartite graph) 形式的行為數據上，取得了很好的效果。該算法已被 IEEE BigData 2018 (http://cci.drexel.edu/bigdata/bigdata2018/) 接收為長文。第一作者為圣母大學一年級博士生趙通，指導老師是助理教授蔣朦。

方法論

很多關于惡性防范算法的文獻都發現，在用二部圖表示的行為數據上，異常密集的二部子圖（dense bipartite core）十分可疑。當我們用矩陣 A 來表示這個二部圖時，原圖中密集的子圖就變成了矩陣 A 之中密集的子矩陣。現有的傳統方法大多是通過各種方式最終給每一個主動方打上一個可疑程度的分數，這些分數放在一起就是一個長度為主動方總數的向量 p。然后，再去優化那些較可疑的主動方所形成的子矩陣 ${A}_{sub}$ 的密度 J ，所以目標方程可以表達為：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

與傳統地去優化主動方可疑程度這一變量的方法不同，AOO 的思路在于優化被動方的防御等級，使得最終被屏蔽掉的行為成為一個密度遠大于正常數據的子矩陣。AOO 要去給每個被動方一個針對主動方的某個特性的防御等級或是門檻，它們放在一起則是一個長度為被動方總數的向量 v。當主動方 i 的特性不能滿足被動方 j 的門檻時，j 便可以屏蔽掉與 i 的這次行為。那么優化這個被屏蔽掉的行文所形成的子矩陣的目標方程就是：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

這兩個公式看似相似，實則大不相同。因為他們完全從主動方和被動方兩個角度切入了這個研究問題。并且實際上只有被動方才是可以提前防范惡意行為的執行者。

在網購平臺中，主動方（買家）的特征可以為這個買家的歷史平均評分。被動方（賣家）的防御等級自然如同上文中提到的淘寶插件，是一個可以在此店購買的商品的買家平均評分門檻。如此以來，當買家的歷史平均評分低于賣家的門檻時，這個買家就無法在這家店購物。

當我們給定一個數據集后，通過給每個賣家生成一個門檻而生成一個長度為賣家數量的相當 v 之后，我們便可以利用 v 和 A 來計算出一個 0/1 矩陣 B。對于 B 中的每一個值 ${B}_{ij}$ ，若賣家 j 會屏蔽掉與買家 ‘i 的交易， ${B}_{ij}$ 的值就是 1，如不會屏蔽則為 0。當然，只有本來就有交易的買家與賣家才會被考慮，所以我們用矩陣 I 來表示交易存在與否，即如果賣家 j 與買家 i 之間本來就沒有交易， ${I}_{ij}$ 自然是 0，反之則為 1。

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖四：簡單的評分數據樣例演示矩陣 A 與 B

如果用數學公式來表達的話。我們首先可以方便地求得表示每個買家歷史平均打分的向量 u：（m 為買家的數量，n 為賣家的數量）

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

然后我們便可求得矩陣 B：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

接下來，我們只需要找出矩陣 B 中，被屏蔽了一定次數（ ${B}^{u}$ ）的買家以及屏蔽了一定數量（ ${B}^{v}$ ）買家的賣家。我們通過兩個 0/1 向量 ${s}^{u}$ 和 ${s}^{v}$ 來指示相應的買家和賣家是否為霸凌者與被霸凌者：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

這些買家與賣家形成一個子矩陣，我們的目標是最大化這個子矩陣的密度。在求它的密度之前我們首先需要求出這個子矩陣的大小（長 ${n}_{u}$ 寬 ${n}_{v}$ ）與他的內容之和（e）：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

所以我們的目標方程可以表示為：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

通過對帶有矩陣變量的函數求偏導，可以求得該目標方程關于 v 的一階導數。由于我們的目標方程較為復雜，我們首先對其進行簡單的分解：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

這樣我們只需要求出這個式子中的三個重要的偏導便可得出最終目標方程的導數。這三個偏導為：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

（其中為 sigmoid 方程，為 sigmoid 方程的參數，具體推導過程請參照原論文。）

有了目標方程關于 v 的導數后，我們只需通過梯度下降法便可優化出一個優秀的向量 v，而其中所包含的正是每個賣家所需要設置的門檻。通過利用整個平臺的大數據所優化出的每個賣家的門檻，自然會比賣家自己憑借少量經驗所設置的要有效得多，而且不會「誤傷」太多誠實買家從而更多地保留了銷售額。

實驗分析

在實驗中，這篇論文同時用了人造數據以及真實數據來佐證其效果。文中的人造數據設定十份復雜以求盡量涵蓋多種現實中可能出現的情況。在人造數據中，本文所提出的 AOO 與多個最為流行的異常行為檢測算法和欺詐行為檢測算法做了對比，并取得了相同或更優秀的結果。

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖五：當有一組或多組霸凌買家時，方法在霸凌買家做出不同數量的差評時的效果。與流行的幾個異常行為檢測算法（KDD'14, KDD'16）作比較，AOO 的效果幾近完美。

在真實數據的實驗中，由于并沒有任何平臺公開過帶有是否為霸凌買家的標簽的數據，這篇論文采用了美國亞馬遜（Amazon.com）的商品評論數據，并對 AOO 所檢測出的疑似惡意產品評論與其他的買家所做出的產品評論做了對比。結果十分有趣：

BigData 2018 最前沿：讓人工智能找到可操作的防范惡行最優決策

圖六：美國亞馬遜商品評論詞云

在圖六中，圖六（a）所顯示的是整個數據集中所有商品評論的用詞頻率的詞云，從中可以看出整體數據集是傾向于好評的，用戶也有用了很多非常正面的詞匯比如：good, love, like, great 等。圖六（b）所顯示的是 AOO 所檢測出的可疑差評的詞云，圖六（c）所顯示的是 AOO 認為并不可疑的評論中的差評的詞云。從圖中可以看出，在同樣都是差評，同樣都出現了高頻率的 bad, boring 等負面詞匯的情況下：圖六（c）中的詞匯更為溫和，如 disappointing, problem, unfortunately；而圖六（b）中的詞匯卻很暴戾甚至帶有侮辱性，如 terrible, stupid, horrible, hell。雖然數據本身并無官方標簽來驗證 AOO 所得出的結果是否正確，但是數據中的評論詞匯說明了這些用戶帶有更多的惡意。

小結

在本文中，我們簡單地介紹了 BigData2018 這篇防范惡意行為的論文。這篇論文新穎地提出了從用戶、被害者的角度去提前防范惡意行為的思路。文中的 AOO 模型雖然已經在評分的數據中取得了不錯的效果，但是要想讓人們在多種復雜的生活環境中去防范各種各樣的惡意行為，還需學者們對這一領域進行更加深入的研究。相信不久之后會有越來越多的從用戶的角度關注問題的相關文章出現，更多以人為本的研究課題被提出。讓我們拭目以待！

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

5人收藏

叢末

編輯

發私信

當月熱門文章