成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發(fā)私信給三川
    發(fā)送

    2

    谷歌搜索也是拼了!為上馬神經(jīng)網(wǎng)絡,百名 PhD人工處理數(shù)據(jù)

    本文作者: 三川 2016-11-30 16:46
    導語:近日,谷歌把神經(jīng)網(wǎng)絡算法加入手機端搜索。這背后有百名語言學博士,夜以繼日地給文本數(shù)據(jù)添加標簽。

    編者按:近日,谷歌把神經(jīng)網(wǎng)絡算法加入手機端搜索。為了讓搜索更智能,谷歌在全世界聘用了百名語言學博士,夜以繼日地標注文本數(shù)據(jù),來訓練神經(jīng)網(wǎng)絡。雖然無監(jiān)督學習成為熱點已有些時日,谷歌還未能擺脫人工處理數(shù)據(jù)的困境。

    谷歌搜索也是拼了!為上馬神經(jīng)網(wǎng)絡,百名 PhD人工處理數(shù)據(jù)

    搜索“世界上最快的鳥是什么?”

    谷歌會告訴你:“游隼。根據(jù) Youtube,游隼被記錄下最高 389 km/h 的時速。”

    這的確是正確答案,但它并非來自于谷歌的數(shù)據(jù)庫。當你輸入這個問題的時候,谷歌搜索引擎找出了一個描述世界上五種最快鳥兒的 Youtube 視頻。然后它只把最快的“一種”鳥兒的信息提取出來,不提及另外四種。

    這是谷歌搜索最新的技術進展。為了回答這些問題,谷歌需要借助深度神經(jīng)網(wǎng)絡。作為 AI 技術之一,它不僅正在重塑谷歌搜索引擎,還在革新谷歌全套人工智能服務。其它互聯(lián)網(wǎng)巨頭當然也受到波及,例如 Facebook 和微軟。

    深度神經(jīng)網(wǎng)絡是一種模式識別系統(tǒng)。它能通過分析海量數(shù)據(jù),學習如何處理特定任務。這個例子中,它學會了怎么在網(wǎng)絡上的長篇文字中找出相關的一句或一段話,然后提取其中的要點呈現(xiàn)給你。

    移動端谷歌搜索剛剛上線這種“句子壓縮算法”(sentence compression algorithms)。這個對人類來說很簡單,但對傳統(tǒng)的機器來說很難的任務,終于能被 AI 系統(tǒng)完成。這說明,深度學習正在促進自然語言理解這門藝術(理解并回應人類語言)的發(fā)展。

    谷歌研發(fā)產(chǎn)品經(jīng)理 David Orr 說:“對于“句子壓縮”,你不得不使用神經(jīng)網(wǎng)絡算法,因為這是目前我們發(fā)現(xiàn)的唯一方法。”

    為了訓練神經(jīng)網(wǎng)絡算法,谷歌在全世界聘用了約百名語言學博士處理數(shù)據(jù),對它們?nèi)斯ずY選。事實上,谷歌的系統(tǒng)是從人類那里學習,怎么在大段文字中提取有用信息。而這過程需要一遍遍地重復——這是深度學習一個很大的限制。雇傭大批語言學家不停地篩選數(shù)據(jù)既麻煩又極其昂貴,但短期內(nèi)谷歌沒有別的辦法。

    谷歌搜索也是拼了!為上馬神經(jīng)網(wǎng)絡,百名 PhD人工處理數(shù)據(jù)

    “黃金數(shù)據(jù)”和“白銀數(shù)據(jù)”

    谷歌也使用過期的新聞來訓練 AI 問答系統(tǒng)。這使 AI 逐漸理解,新聞標題是如何對文章主體進行歸納的。但這并不意味著谷歌不需要成批語言學家了。他們不僅示范句子壓縮,還要對語句的不同部分做標記,以幫助神經(jīng)網(wǎng)絡理解人類語言是如何工作的。David Orr 把谷歌語言學家團隊處理的數(shù)據(jù)稱為“黃金數(shù)據(jù)”,過期新聞則是“白銀數(shù)據(jù)”。“白銀數(shù)據(jù)”作用不小,因為它的體量很大。但價值最大的還是“黃金數(shù)據(jù)”,它們是 AI 訓練的核心。語言學家團隊的負責人 Linne Ha 透露,在可見的將來,語言學家隊伍仍會繼續(xù)擴大。

    谷歌搜索也是拼了!為上馬神經(jīng)網(wǎng)絡,百名 PhD人工處理數(shù)據(jù)

    這類需要人工輔助的 AI 學習便是“監(jiān)督學習”(supervised learning),目前,神經(jīng)網(wǎng)絡都是這么運作的。有時候公司會把這個業(yè)務進行眾包,有時候它會自發(fā)地進行。比方說,全世界的網(wǎng)民已經(jīng)為數(shù)百萬的貓咪照片添加了“貓咪”標簽,這會讓神經(jīng)網(wǎng)絡學習識別貓咪變得很簡單——訓練數(shù)據(jù)已經(jīng)處理好了。但很多情況下,研究人員們別無選擇,只能自己一次次為數(shù)據(jù)添加標簽。

    深度學習初創(chuàng)公司Skymind 的創(chuàng)始人 Chris Nicholson 認為,長遠來看,人工標注數(shù)據(jù)是不可行的。他說:“將來一定不會是這樣。這是極度枯燥的活兒。我想不出比這更無聊的 PhD 工作了。”

    監(jiān)督學習的缺陷遠不止如此:除非谷歌聘請所有語言的語言學家,否則這個系統(tǒng)無法在其他語言中運轉(zhuǎn)。現(xiàn)在,語言學家團隊的工作橫跨了 20 至 30 種語言。谷歌必須在將來的某一天,采取更自動化的 AI 訓練方式,即“無監(jiān)督學習”(unsupervised learning)。

    到了那時,機器將能夠從未經(jīng)人工標注的數(shù)據(jù)中學習。互聯(lián)網(wǎng)上海量的數(shù)字信息可以被直接用于神經(jīng)網(wǎng)絡學習。 Google、Facebook 和 OpenAI這樣的巨頭們已經(jīng)開始這個領域的研究,但它的實際應用仍然非常遙遠。現(xiàn)在,AI 學習仍然需要幕后的大批語言學家隊伍。

    via wired

    【招聘】雷鋒網(wǎng)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領域第一時間提供海外科技動態(tài)與資訊。我們需要若干關注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。工作地點深圳。簡歷投遞至 guoyixin@leiphone.com 。兼職及實習均可。

    相關文章:

    Facebook Yann LeCun一小時演講: AI 研究的下一站是無監(jiān)督學習(附完整視頻)

    專訪 Jeff Dean丨谷歌戰(zhàn)神談增強學習和無監(jiān)督學習

    AI 黑箱難題怎么破?基于神經(jīng)網(wǎng)絡模型的算法使機器學習透明化

    回顧Google神經(jīng)網(wǎng)絡機器翻譯上線歷程 | 深度

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    谷歌搜索也是拼了!為上馬神經(jīng)網(wǎng)絡,百名 PhD人工處理數(shù)據(jù)

    分享:
    相關文章

    用愛救世界
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說