1
整個人類似乎發展地很好:互聯網經濟、奧林匹克運動會、火箭發射、太空漫游......
然而這樣繁榮的圖景并不是人類的全部,世界上還依然充滿了貧困和戰亂。就像這個在敘利亞戰亂剛剛遭遇空襲的5歲小男孩Omran Daqneesh,出人意料地安靜、麻木和茫然,不哭不鬧地擦掉自己臉上的血,而誰又知道他經歷了怎樣的殘酷!

人們樂于分享幸福與富裕,而戰亂和貧困地區人的日常和生活水平,我們很難得知。盡管有那么多國際機構聲稱要去要去幫助,去改變,然而由于無法了解基本信息,很難對癥下藥。
長久以來,研究人員會有一個評估某一地區的發展程度的指標:夜晚燈光的亮度和密度。但是這個方法有個局限,那就是它只能看到亮著的地區,而對于那些夜晚的黑暗之地,我們只能判斷它們大致是貧困的,而究竟貧困到什么程度,就不得而知。
“非洲最窮的地方,是我們最關心的。但在晚上,那里幾乎全部都是黑暗之地。”斯坦福大學的電子工程與計算機科學博士Neal Jean說道。

兩個村莊,一個靠近湖邊,一個靠近森林,在燈光分布圖里都可能是全暗的,但是它們臨近不同的自然資源,富裕程度不一樣。
而且,一般來說,了解一個地區的經濟水平,需要進行調研,而這一方法在戰亂和沖突地區是無法展開的,而恰巧這些地區就是世上最窮之地。
國際組織和當地政府決策者最在乎這些數據。比如,一個公益性國際組織要對不發達地區進行資金援助,資金是有限的,他們就需要確切知道哪些地區的需求最懇切,所謂“把錢花在刀刃上”。
對于政策制定者而言,了解本國個地區的經濟發展狀況是一項必須進行的工作,因為這樣才能制定出針對性的發展方案。但事實是什么呢?世界銀行數據顯示,在2000-20010年的十年時間里,59個非洲國家中,有39個國家只進行了不到2次的貧困水平調查。
斯坦福大學的這撥以Jean為領導的研究人員,他們采取的是現在很流行的卷積神經網絡的機器學習算法,所用的數據分白天的和晚上的,白天的數據來自衛星拍攝的地球高清圖像,夜晚的數據就是燈光分布圖。
整個的算法分兩步。第一步叫做“遷移學習”(Transfer Learning),研究人員把五個國家的白天和夜晚的數據“喂給"系統,包括尼日利亞、坦桑尼亞、烏干達、馬拉維、盧旺達這五個非洲國家。計算機需要學習衛星照片上的物體與夜晚燈光亮度的關系。
比如系統可以學習到:一片湖區和一片森林,他們在晚上應當是黑暗的,這與該地區是否貧困并無關聯;但是,一個房屋聚集的村莊,理應夜晚亮度比較高,如果這片區域是黑暗的,那么極有可能就是貧困地區。
通過這樣的學習,系統將貧困地區的數據都提取出來。接下來,就進行第二步,叫做“嶺回歸模型”(Ridge Regression Model)。研究人員將經過真實調查的數據指標再次“喂給”系統,比如世界銀行生活水平測量研究等。
這次,系統會把未經過調查統計的地區的大致貧困程度預測出來。比如,系統已經知道一個10戶房屋的村莊A的夜晚大致燈光亮度,而調查報告里有一個與A村地理位置相近,而且燈光亮度相似的10戶村莊B的信息,報告顯示B村的家庭收入水平是1.9美元/天。那么系統通過交叉對比,就可以判斷出A村與B村有著相似的經濟水平。
這個分兩步走的算法系統比單一的依靠燈光預測的方法更為準確,在具體的實驗里,其準確率達到81%-99%。
另外,由于該系統使用的數據都是來自公共機構,比如衛星圖像和燈光分布圖就是來自NASA,而調查報告來自于美國政府和國際組織,所以整個系統的花費并不昂貴,可供有需要的公眾和機構免費使用。
Jean表示,系統目前數據只是來自非洲的五個國家,下一步的工作就是用其他國家的數據來訓練,以繪制出全球貧困地圖,幫助政府和機構更好地減輕世界貧困。
Via Spectrum
延伸閱讀:
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。