容量至關(guān)重要!
我們還觀察到,為了充分利用3億張圖像,需要更高容量的模型。例如,在ResNet-50的情況下,COCO對象檢測的增益(1.87%),比使用ResNet-152(3%)時,要小得多。
長尾訓(xùn)練:我們的數(shù)據(jù)有相當長的尾巴,表征學習似乎有效。這種長尾似乎不會對卷積神經(jīng)網(wǎng)絡(luò)的隨機訓(xùn)練產(chǎn)生不利影響(訓(xùn)練仍然趨于收斂)。
最新技術(shù)成果:最后,我們的論文使用從JFT-300M獲得模型,在幾個基準上提出了新成果。例如,一個單一的模型(沒有任何bell和whistle)AP(目標檢測中衡量檢測精度的指標)達到 37.4,而COCO檢測基準的AP為34.3。