成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能開發者 正文
    發私信給汪思穎
    發送

    0

    Google圖片數據集發布最新 V3 版,涵蓋600個對象類的標記邊框

    本文作者: 汪思穎 2017-11-23 17:53
    導語:比起今年7月份發布的 V2 版,訓練集上的邊框標簽和圖像層級標簽都大大增加。

    雷鋒網 AI科技評論消息,日前,谷歌發布 Open Images Dataset (開發圖片數據集)的 V3 版,比起今年7月份發布的 V2 版,這一最新版本的邊框(bounding box)數和圖像層級標簽(image-level label)數都大大增加。

    Google圖片數據集發布最新 V3 版,涵蓋600個對象類的標記邊框

    圖: Open Images Dataset 中的標記圖像

    Open Images Dataset 包含900萬張圖片 URL,里面的圖片都已經被標記,帶有標簽和邊框,橫跨成千上萬個類。大家現在可以點擊 https://github.com/cvdfoundation/open-images-dataset 進行下載。

    該數據集包括一個訓練集(9,011,219張圖像)、一個驗證集(41,620張圖像)和一個測試集(125,436張圖像)。在 V2 版本中, V1 版本的驗證集被分割成驗證集和測試集,這是為了更易于評估。圖像的標簽和邊框描述如下:

    圖像層級標簽

    下表是不同數據集中圖像層級標簽的概況,可以通過類似于 Google Cloud Vision API 的計算機視覺模型自動生成所有圖片的圖像層級標簽。

    Google圖片數據集發布最新 V3 版,涵蓋600個對象類的標記邊框

    驗證集和測試集中的所有圖像,以及訓練集中的一部分圖像都帶有經過人工驗證的圖像層級標簽。大部分的人工驗證都已經在谷歌內部手工完成了,另外一小部分是通過在Image Labeler(Crowdsource app, g.co/imagelabeler)上進行眾包驗證來完成的。這種人工驗證雖然可以消除掉錯誤信息,但卻不能發現漏報情況,所以圖像中可能會缺失某些標簽。產生樣本的模型不只是上面提到的自動生成標簽的模型,還覆蓋其他很多計算機視覺模型,所以類的數量大大增加了。

    在數據集中,共有19,995個帶有圖像層級標簽的不同的類,其中19,693個類中至少有一個經過人類驗證的標簽,7870個類中帶有機器生成的標簽。

    邊框

    下表是在所有數據集中邊框標記的概況,其中包括600個對象類。這個數量遠遠大于在 ILSVRC 和 COCO 挑戰賽中涵蓋的類,另外還增加了諸如 fedora 帽和雪人等新的對象。

    Google圖片數據集發布最新 V3 版,涵蓋600個對象類的標記邊框

    Google 為驗證集和測試集中的所有對象實例提供完整的邊界框注釋,這些都是在公司內部通過手工標記的。此外,他們還盡可能地嘗試在語義層次(semantic hierarchy)上將邊框標記得足夠具體。

    例如,汽車有兩輛,一輛是兒童豪華轎車,一輛是貨車。豪華轎車(limousine)和貨車(van)被標記為limousine和van,而所有其他類型的汽車(car)被標記為汽車(car)。

    此外,注解者還為每個邊框標記了一組屬性,例如指示對象是否被遮擋。驗證集和測試集中的每個圖像平均大約有5個邊框。

    Data Formats數據格式

    數據原始碼包含如下文件:

    images.csv

    在訓練集、驗證集和測試集中的每個子集中都會有這樣的文件。這里面包含圖片URL、OpenImage ID、標題、作者和許可信息:

    ImageID,Subset,OriginalURL,OriginalLandingURL,License,AuthorProfileURL,Author,Title,\

    OriginalSize,OriginalMD5,Thumbnail300KURL

    ...

    000060e3121c7305,train,https://c1.staticflickr.com/5/4129/5215831864_46f356962f_o.jpg,\

    https://www.flickr.com/photos/brokentaco/5215831864,\

    https://creativecommons.org/licenses/by/2.0/,\

    "https://www.flickr.com/people/brokentaco/","David","28 Nov 2010 Our new house."\

    211079,0Sad+xMj2ttXM1U8meEJ0A==,https://c1.staticflickr.com/5/4129/5215831864_ee4e8c6535_z.jpg

    ...

    每個圖片中都有一個惟一的64位指定 ID,在 CSV 文件中,它們顯示成十六進制整數(用零填充),例如000060e3121c7305。

    annotations-machine.csv

    這是通過機器生成的圖像層級標簽(每個訓練集、驗證集和測試集中都有)。

    ImageID,Source,LabelName,Confidence

    000002b66c9c498e,machine,/m/05_4_,0.7

    000002b66c9c498e,machine,/m/0krfg,0.7

    000002b66c9c498e,machine,/m/01kcnl,0.5

    000002b97e5471a0,machine,/m/05_5t0l,0.9

    000002b97e5471a0,machine,/m/0cgh4,0.8

    000002b97e5471a0,machine,/m/0dx1j,0.8

    000002b97e5471a0,machine,/m/039jbq,0.8

    000002b97e5471a0,machine,/m/03nfmq,0.8

    000002b97e5471a0,machine,/m/03jm5,0.7

    ...

    這些是通過與 Google Cloud Vision API 類似的計算機視覺模型生成的。

    annotations-human.csv

    這是通過人工驗證的圖像層級標簽(每個訓練集、驗證集和測試集中都有)。

    ImageID,Source,LabelName,Confidence

    000026e7ee790996,verification,/m/04hgtk,0

    000026e7ee790996,verification,/m/07j7r,1

    000026e7ee790996,crowdsource-verification,/m/01bqvp,1

    000026e7ee790996,crowdsource-verification,/m/0csby,1

    000026e7ee790996,verification,/m/01_m7,0

    000026e7ee790996,verification,/m/01cbzq,1

    000026e7ee790996,verification,/m/01czv3,0

    000026e7ee790996,verification,/m/01v4jb,0

    000026e7ee790996,verification,/m/03d1rd,0

    ...

    這些源代碼指示了標簽是如何生成的:

    • "verification"是人工驗證的圖像層級標簽。

    • "crowdsource-verification"是通過Crowdsource(眾包) APP進行人工驗證的標簽。

    annotations-human-bbox.csv

    這是有邊框坐標的人工標簽(每個訓練集、驗證集和測試集中都有)

    訓練集標簽和邊框坐標如下所示:

    ImageID,Source,LabelName,Confidence,XMin,XMax,YMin,YMax

    000002b66c9c498e,activemil,/m/0284d,1,0.560250,0.951487,0.696401,1.000000

    000002b66c9c498e,activemil,/m/052lwg6,1,0.543036,0.907668,0.699531,0.995305

    000002b66c9c498e,activemil,/m/0fszt,1,0.510172,0.979656,0.641628,0.987480

    000002b66c9c498e,verification,/m/01mzpv,1,0.018750,0.098438,0.767187,0.892187

    000002b66c9c498e,xclick,/m/01g317,1,0.012520,0.195618,0.148670,0.588419

    000002b66c9c498e,xclick,/m/0284d,1,0.528951,0.924883,0.676056,0.965571

    000002b66c9c498e,xclick,/m/02wbm,1,0.530516,0.923318,0.668232,0.976526

    000002b66c9c498e,xclick,/m/052lwg6,1,0.516432,0.928012,0.651017,0.985915

    000002b66c9c498e,xclick,/m/0fszt,1,0.525822,0.920188,0.669797,0.971831

    ...

    驗證集和測試集的額外屬性也給出來了:

    ImageID,Source,LabelName,Confidence,XMin,XMax,YMin,YMax,IsOccluded,IsTruncated,IsGroupOf,IsDepiction,IsInside

    000026e7ee790996,freeform,/m/07j7r,1,0.071905,0.145346,0.206591,0.391306,0,1,1,0,0

    000026e7ee790996,freeform,/m/07j7r,1,0.439756,0.572466,0.264153,0.435122,0,1,1,0,0

    000026e7ee790996,freeform,/m/07j7r,1,0.668455,1.000000,0.000000,0.552825,0,1,1,0,0

    000062a39995e348,freeform,/m/015p6,1,0.205719,0.849912,0.154144,1.000000,0,0,0,0,0

    000062a39995e348,freeform,/m/05s2s,1,0.137133,0.377634,0.000000,0.884185,1,1,0,0,0

    0000c64e1253d68f,freeform,/m/07yv9,1,0.000000,0.973850,0.000000,0.043342,0,1,1,0,0

    0000c64e1253d68f,freeform,/m/0k4j,1,0.000000,0.513534,0.321356,0.689661,0,1,0,0,0

    0000c64e1253d68f,freeform,/m/0k4j,1,0.016515,0.268228,0.299368,0.462906,1,0,0,0,0

    0000c64e1253d68f,freeform,/m/0k4j,1,0.481498,0.904376,0.232029,0.489017,1,0,0,0,0

    class-descriptions.csv

    通過查閱class-descriptions.csv,可以將標簽的MID轉換成相關短描述

    ...

    /m/025dyy,Box

    /m/025f_6,Dussehra

    /m/025fh,Professor x

    /m/025fnn,Savannah Sparrow

    /m/025fsf,Stapler

    /m/025gg7,Jaguar x-type

    /m/02_5h,Figure skating

    /m/025_h00,Solid-state drive

    /m/025_h88,White tailed prairie dog

    /m/025_hbp,Mercury monterey

    /m/025h_m,Yellow rumped Warbler

    /m/025khl,Sp?tzle

    ...

    需要注意逗號、引號等,該文件格式遵循標準的CSV格式,示例如下:

    /m/02wvth,"Fiat 500 ""topolino"""

    /m/03gtp5,Lamb's quarters

    /m/03hgsf0,"Lemon, lime and bitters"

    classes.txt

    這是19,995個圖像層級類的清單

    /m/0100nhbf

    /m/0104x9kv

    /m/0105jzwx

    /m/0105ld7g

    /m/0105lxy5

    /m/0105n86x

    /m/0105ts35

    /m/0108_09c

    /m/01_097

    /m/010dmf

    ...

    classes-trainable.txt

    這是5000個可訓練的圖像層級類的清單

    classes-bbox.txt

    這是600個邊框層級類的清單

    classes-bbox-trainable.txt

    這是545個可訓練邊框層級類的清單

    雷鋒網 AI科技評論編譯整理。雷鋒網

    via:Open Images Dataset

    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    Google圖片數據集發布最新 V3 版,涵蓋600個對象類的標記邊框

    分享:
    相關文章

    編輯

    關注AI學術,例如論文
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說