成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能開發(fā)者 正文
    發(fā)私信給MrBear
    發(fā)送

    0

    2018 Data Science Bowl 第一名方案新鮮出爐,鑒定細胞核新技能 get

    本文作者: MrBear 編輯:汪思穎 2018-04-24 10:18
    導語:此次比賽中性能最好的模型是:DPN-92, Resnet-152,INceptionResnetV2,Resnet101

    雷鋒網(wǎng) AI 研習社按:最近一段時間以來,醫(yī)學影像作為人工智能重要的應(yīng)用領(lǐng)域,受到學界和越來越多 AI 公司的關(guān)注。Nature、Science、Cell 上頻頻刊登在醫(yī)療影像中應(yīng)用 AI 的文章,谷歌、IBM、依圖科技等公司也紛紛加入 AI+ 醫(yī)療的競爭……

    作為全球最大的數(shù)據(jù)科學競賽平臺,Kaggle 也順理成章搭上了這班順風車,與 Booz Allen Hamilton 咨詢公司一同推出了 2018 年 Data Science Bowl 比賽。

    眾所周知,鑒定細胞的細胞核是大多數(shù)醫(yī)學分析的起點。人體 30 萬億細胞中,大部分都有細胞核,而這些細胞核中存儲了 DNA。識別細胞核可以讓研究人員識別樣本中的每一個細胞,通過測量細胞對各種治療措施的反應(yīng),研究人員可以了解潛在的生物過程,進而提高藥物檢測的效率,縮短新藥的開發(fā)周期。

    本次比賽要求參賽者構(gòu)建計算機視覺模型,從圖片中識別不同條件下的細胞核,并且以均值平均精度(MaP)和交并比(IoU)作為評價指標。該比賽獎池巨大,達到了 10 萬美金之多,共吸引了 861 支隊伍。

    下面是第一名的解決方案,雷鋒網(wǎng) AI 研習社編譯整理如下。

    U.Net vs Mask-RCNN

    我們之前有參加過圖像分割挑戰(zhàn)賽(如 Carvana,Urban 3D,Spacenet,Konica Minolta),在這些比賽中,我們積累了豐富的經(jīng)驗。因此,這一次比賽的選擇非常明確——開了掛的 U-Net!

    目標掩膜(target mask)

    首先,我們嘗試了最簡單的方法,并將針對二進制掩膜的分水嶺算法加入其中(換言之,修改 GT 掩膜使得細胞核之間總是存在間隙),這讓我們在公開榜單上獲得了大約 500 的分數(shù)。顯然,這不足以贏得比賽。

    然后,我們加入了代表輪廓的通道,輪廓的寬度取決于細胞核的大小。這些掩膜 + 簡單的分水嶺后置處理算法讓我們在公開榜單上大約獲得了 525 分。盡管這并不是一個大的突破,但是它給了我們對正確方向的啟示。

    回過頭來看這些錯誤,很明顯,網(wǎng)絡(luò)很容易在不模糊的地方預測輪廓。然而,在我們真正需要通過輪廓去分割出細胞核的地方,這些網(wǎng)絡(luò)的表現(xiàn)卻非常糟糕。因此,我們決定只預測細胞之間的邊界。很容易地,我們通過單一的網(wǎng)絡(luò)處理結(jié)果 + 分水嶺后置處理在公共榜單上獲得了大于 550 的分數(shù)。

    盡管我們在一個通道中有全掩膜,在另一個通道中有細胞的邊界,但有時結(jié)果還是不夠好。一個更好的方法是改變原子核的掩膜并且使邊界上的像素點變成空白。這也讓我們能夠使用 softmax 而不是 sigmoid 函數(shù)作為激活函數(shù)。這樣可以更好地分離出原子核,但是實際上,由于交并比(IoU)的閾值太高,均值平均精度(MaP)卻被降低了。我們通過額外在全掩膜上訓練的網(wǎng)絡(luò)去解決這個問題,并且在后置處理的步驟中將結(jié)果進行融合。

    最終方案

    • 2 通道 sigmoid 激活函數(shù)掩膜網(wǎng)絡(luò)(例如,掩膜-邊界、邊界)或3通道 softmax 激活函數(shù)掩膜網(wǎng)絡(luò)(例如,掩膜-邊界、邊界、1-掩膜-邊界)

    • 2 通道全掩膜(例如,掩膜、邊界)

    對于圖c43e356beedae15fec60ae3f8b06ea8e9036081951deb7e44f481b15b3acfc37,處理結(jié)果看起來是這樣的:

    2018 Data Science Bowl 第一名方案新鮮出爐,鑒定細胞核新技能 get

    在 post 處理之后的結(jié)果為:

    2018 Data Science Bowl 第一名方案新鮮出爐,鑒定細胞核新技能 get

    圖像增強

    由于只有幾百張訓練圖像,我們需要提出具體的數(shù)據(jù)增強方案來防止模型過擬合,更好地泛化。我們用了大量的數(shù)據(jù)增強方法(或許太多了)

    • 對比度受限自適應(yīng)直方圖均衡化算法(Clahe),銳化(Sharpen),凸點(Emboss)

    • 高斯噪聲

    • 彩圖到灰度轉(zhuǎn)換(Color to Gray)

    • 反相——我們本不該使用它的,這種方法使得第二階段一些圖像沒有被準確地預測

    • 將灰度圖重新映射到隨機顏色的圖像中

    • 模糊(Blur)、一般模糊(Median Blur)、非常模糊(Motion Blur)

    • 對比度和亮度

    • 隨機縮放、旋轉(zhuǎn)、翻轉(zhuǎn)

    • 重度幾何變換:彈性變換(Elastic Transform)、透視變換(Perspective Transform)、分段仿射變換(Piecewise Affine transforms)、枕形畸變(Pincushion Distortion)

    • 隨機色相、飽和度、明度(HSV)變換

    • 通道重排——由于數(shù)據(jù)的天然性,這一點非常重要

    • 圖像上細胞核的復制。這樣就創(chuàng)造了大量重疊的細胞核,似乎有助于網(wǎng)絡(luò)更好地學到重疊細胞核的邊界。

    網(wǎng)絡(luò)架構(gòu)

    我們使用在 ImageNet 上預訓練好的、類似于編碼器——解碼器結(jié)構(gòu)的 UNet 網(wǎng)絡(luò)。

    令人驚訝的是,像 VGG16 這樣的簡單編碼器根本不適用于這個比賽,比如在細胞組織上看起來像細胞核(但事實上并不是)的困難情況下就失敗了,尤其是在像 59b35151d4a7a5ffdd7ab7f171b142db8cfe40beeee67277fac6adca4d042c4 這種彩色圖片中:

    這些實驗之后,我們決定進行更加深入的研究!結(jié)果顯示,本次比賽中性能最好的模型是:DPN-92, Resnet-152,INceptionResnetV2,Resnet101

    二級模型/后置處理

    在這個部分,我們使用預測出的細胞核作為候選,來訓練 LightGBM 模型。每一個候選都是通過最低的(決策樹)分裂閾值挑選出來的,并且試圖與較高的閾值和損失分開。我們使用幾個基本的形態(tài)學特征來描繪候選,例如:堅固性、循環(huán)性、凸性、面積、計數(shù)等。預測目標是交互比,之后根據(jù)預測出的交互比選擇候選的最佳閾值,將交互比很小的候選直接刪除。

    額外數(shù)據(jù)

    我們從 janowczyk、nucleisegmentationbenchmark、isbi2009、BBBC020、TNBC 數(shù)據(jù)集中額外添加了一些圖像,其中一部分圖像降低了我們在公共榜單上的得分,使得對彩色圖片的預測不那么準確。很遺憾的是我們沒有時間去找到問題的根源,進而做出進一步的調(diào)整。

    集成

    我們使用了一種簡單的方法:僅僅在后置處理之前對掩膜的結(jié)果取了平均。

    訓練

    • 隨機裁剪(random crops): 256*256

    • 批處理尺寸(batch size):16

    • 優(yōu)化器:Adam

    • 學習率:初始值為十的負四次方(我們有不同的 LR 策略,但是大多數(shù)情況下選擇不超過十的負四次方的小 LR 值)。

    損失函數(shù)

    對于使用 sigmoid 激活函數(shù)和 2 通道掩膜的網(wǎng)絡(luò),我們?yōu)槊總€通道使用「binary_crossdentropy」和「soft_dice」的組合。 對于使用 softmax 激活函數(shù)和 3 通道掩膜的網(wǎng)絡(luò),我們?yōu)槊總€通道使用 「categorical_crossentropy」和「soft_dice」(soft dice 僅僅適用于掩膜和邊界通道)

    測試時間增強

    標準翻轉(zhuǎn)/旋轉(zhuǎn)(0度,90度,180度,270度)。

    via Kaggle

    雷鋒網(wǎng) AI 研習社編譯整理。

    雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    2018 Data Science Bowl 第一名方案新鮮出爐,鑒定細胞核新技能 get

    分享:
    相關(guān)文章

    知情人士

    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說