在征信中,我們會(huì)把批準(zhǔn)率和壞賬率結(jié)合起來,也就是在機(jī)器學(xué)習(xí)中把precision(精確率)和recall(召回率)結(jié)合起來,才能作一個(gè)綜合的判斷。
當(dāng)然,征信領(lǐng)域我們用得最多的是KS distance(KS距離),這是俄羅斯的兩位數(shù)學(xué)家名字的首字母。
在金融領(lǐng)域,什么案例能證明機(jī)器學(xué)習(xí)有用?
我們很多模型都在金融機(jī)構(gòu)的完成兩個(gè)維度中至少一個(gè)維度的提高,那就是我們可以在保證批準(zhǔn)率相同的請(qǐng)胯下降低壞賬率,或者在相同的壞賬率的情況下提高批準(zhǔn)率?,F(xiàn)在中國(guó)的征信剛剛起步,我們的模型在很多場(chǎng)景下可以既提高批準(zhǔn)率又可以降低壞賬率,這不是一個(gè)長(zhǎng)遠(yuǎn)的情況。但總體而言,至少要做到單一維度上的提升,才可以稱得上是一個(gè)好的金融科技公司。
下面一個(gè)問題,如何避免機(jī)器出錯(cuò)?
早年我們自己開玩笑,機(jī)器學(xué)習(xí)到底是機(jī)器學(xué)人還是人學(xué)機(jī)器,明明是人在學(xué)機(jī)器,我在卡梅隆6年才拿到我的博士學(xué)位,每天起早貪黑,科比說他看過洛杉磯凌晨4點(diǎn)的樣子,我說這有什么稀奇的,我經(jīng)??吹?點(diǎn)的匹茲堡。從我的經(jīng)驗(yàn)來看,不是機(jī)器在學(xué)習(xí)人,而是人在學(xué)習(xí)機(jī)器。