數(shù)據(jù)譜系 – 數(shù)據(jù)是從哪里來的? 是有效的來源嗎? 當(dāng)使用內(nèi)部系統(tǒng)的時(shí)候數(shù)據(jù)譜系沒有那么重要,因?yàn)閿?shù)據(jù)來源是眾所周知的, 但是許多機(jī)器學(xué)習(xí)系統(tǒng)會(huì)從公共源來獲取數(shù)據(jù)。 或者潛在的從互聯(lián)網(wǎng)上的許多設(shè)備上獲取. 來源于人群的數(shù)據(jù) (例如Waze, 一個(gè)手機(jī)GPS 應(yīng)用) 要求作出額外的努力來確保你可以信任你所使用的的數(shù)據(jù)。想象一種新型的網(wǎng)絡(luò)攻擊, 給你機(jī)器學(xué)習(xí)系統(tǒng)以錯(cuò)誤的數(shù)據(jù)而影響你的結(jié)果。還記得微軟的人工聊天機(jī)器人 AI Chatbot Tay被引導(dǎo)為一個(gè)種族主義者的麻煩事情嗎?
沒有技術(shù)能夠否定好的設(shè)計(jì)和規(guī)劃的需要
毫無疑問:機(jī)器學(xué)習(xí)技術(shù)具有驚人的潛力,無論是在醫(yī)療保健診斷阿爾茨海默氏病還是在曾經(jīng)只出現(xiàn)于科幻小說中的自動(dòng)駕駛汽車上。 沒有技術(shù)能夠否定好的設(shè)計(jì)和規(guī)劃的需要。 機(jī)器學(xué)習(xí)也不例外。 作為技術(shù)專家,確保已作出適當(dāng)?shù)呐ΡM可能為機(jī)器學(xué)習(xí)的實(shí)現(xiàn)提供最好的資源,這是我們的職責(zé)。 了解這些系統(tǒng)的質(zhì)量,體積,時(shí)效性和譜系的需要,可以幫助我們進(jìn)入這個(gè)機(jī)器學(xué)習(xí)的新世界, 引領(lǐng)我們走向成功的執(zhí)行,并最終為企業(yè)提供價(jià)值。