解決方案:ImageNet決定公開提供數(shù)據集中圖像的源鏈接,這樣人們就可以不必從一個大學托管的服務器上來下載這些圖像了。ImageNet僅提供圖像的縮略圖和一個版權侵犯刪除聲明。只有當使用者簽署協(xié)議,保證不將數(shù)據商業(yè)化使用之后,數(shù)據集組織者才提供完整的數(shù)據集。ImageNet具有下述的聲明條款(獲取日期:2015年5月5日):
ImageNet不擁有圖像的版權。ImageNet會以一種圖像搜索引擎的方式,僅提供縮略圖和圖像的URL。也就是說,ImageNet針對每個同義詞集編譯了一個精確的網絡圖片列表。對于希望將圖片用于非商業(yè)化研究和/或教育目的的研究人員和教育工作者來說,在同意我們的一定條件和條款的情況下,我們可以提供通過我們的網站來進行訪問的方式。
2.Caffe:無使用限制的深度學習模式
現(xiàn)在,比較明確的是,我們知道哪里可以下載到可視化大數(shù)據以及它們適用的條款,我們再將目光轉向另一個方面:深度學習訓練過程的輸出結果。我們看一下Caffe,一個非常流行的深度學習庫,它可以用來處理類似于ImageNet的數(shù)據。Caffe提供了一個共享模式的生態(tài)系統(tǒng)(動物園模型),并且已經成為計算機視覺研究者必不可少的工具。Caffe是伯克利視覺和學習中心研發(fā)的,并貢獻給了開源社區(qū)——它是開源的。
“使用Caffe自己動手搭建深度學習計算機視覺”中的一頁幻燈片
問題:作為一個在大學啟動的項目,Caffe旨在成為創(chuàng)建、訓練和分享深度學習模型的事實標準。分享的模型最初是用于非商業(yè)用途,但問題是一波新的初創(chuàng)企業(yè)都使用了這些技術。所以必須有一個許可協(xié)議,允許高校、大型企業(yè)和初創(chuàng)公司來探索同一套預訓練模型。
解決方案:Caffe的當前模型許可是無使用限制的。對于大量的黑客、科學家和工程師們來說這是非常偉大的一件事。需要分享的模型需遵守一項非商業(yè)使用條款。下面是全部的Caffe的模型條款(獲取日期:2015年5月5日):
Caffe模型是BVLC的附屬軟件,它沒有使用的限制。
這些模型利用了ImageNet項目的數(shù)據進行訓練,這些訓練數(shù)據包括了一些從網上獲取的照片,而這些照片可能受到版權保護。
作為研究者,我們目前的理解是:對于這些公開發(fā)布的訓練過的模型權值,其使用不應受到什么限制,因為這里面沒有包含任何原始圖像的全部或者部分。對于現(xiàn)在興起的一種說法,‘權值系由原始圖像訓練所得,其版權應歸屬原始圖像版權所有者’,加州大學伯克利分校沒有做過任何聲明說什么樣的使用是被允許的,而是基于大學使命來對待我們的模型,以盡可能不受限制的方式來傳播知識和工具。
3.Vision.ai:在家里生成和訓練的數(shù)據集
深度學習能夠學習輸入數(shù)據的概要。但是如果另一個不同的模型記住了訓練數(shù)據的詳細細節(jié)會怎樣呢?更重要的是如果模型記住的內容中有你不想對外分享的內容會怎樣呢?為了研究這種情況,我們來看Vision.ai,他們設計的實時計算機視覺服務器用于模擬產生一個數(shù)據集并且學習一個對象的外觀。Vision.ai軟件能夠從視頻和直播的網絡攝像頭流中實時訓練。
不同于從互聯(lián)網上的圖像中收集可視化大數(shù)據(如ImageNet),vision.ai的訓練過程基于一個人在網絡攝像頭面前揮舞一個感興趣的對象。用戶自力更生的學習過程一開始有一個初始邊界框,算法會在不用干預的情況下持續(xù)學習。在算法學習過程中,它會存儲它以前見到的部分歷史信息,從而有效地創(chuàng)建自己的數(shù)據集。因為Vision.ai使用了卷積神經網絡來檢測物體(圖像中目標僅占據很少的一部分),所以收集到的數(shù)據集中還保持了大量的背景數(shù)據。當訓練過程結束后,你同時得到了Caffe類型的信息(學習過的權值)和ImageNet類型的信息(收集的圖像)。那么如果現(xiàn)在進行分享模型,會發(fā)生什么呢?
用戶使用vision.ai的實時檢測器訓練接口來訓練茶杯檢測器
問題:在家里的訓練意味著潛在的私人信息和敏感信息以背景的形式被采集到圖像中。如果你在自己家里訓練模型,然后對公眾開放它,那你在分享的時候就需要三思而后行了。同樣的,你如果從有版權保護的視頻/圖像中訓練了一個物體檢測器,那么當你分享/出售這個模型的時候,也需要考慮其中存在的問題。