解決方法:先進(jìn)行數(shù)據(jù)集劃分,然后再提高訓(xùn)練集中違約客戶的權(quán)重。
___________________________________________________________________________________
11. 太相信最佳模型(Believe the Best Model)
IDMer:還是那句老話-“沒有最好,只有更好!”
可解釋性并不一定總是必要的??雌饋聿⒉煌耆_或者可以解釋的模型,有時(shí)也會有用。
“最佳”模型中使用的一些變量,會分散人們太多的注意力。(不可解釋性有時(shí)也是一個(gè)優(yōu)點(diǎn))
一般來說,很多變量看起來彼此都很相似,而最佳模型的結(jié)構(gòu)看上去也千差萬別,無跡可循。但需注意的是,結(jié)構(gòu)上相似并不意味著功能上也相似。
解決方法:把多個(gè)模型集裝起來可能會帶來更好更穩(wěn)定的結(jié)果。
數(shù)據(jù)挖掘最重要的要素是分析人員的相關(guān)業(yè)務(wù)知識和思維模式。豐富的業(yè)務(wù)知識是設(shè)計(jì)有效的相關(guān)變量的必要條件,而分析人員的思維模式從另外一個(gè)方面也保障了設(shè)計(jì)變量的結(jié)構(gòu)化和完整性。所以我們在掌握豐富的業(yè)務(wù)知識同時(shí),如果能夠按照正確的思維模式去思考問題,將會發(fā)現(xiàn)解決問題并不是很困難的。
更多詳細(xì)信息,請您微信關(guān)注“計(jì)算網(wǎng)”公眾號: