事實(shí)上,用戶(hù)畫(huà)像涉及數(shù)據(jù)的緯度需要業(yè)務(wù)場(chǎng)景結(jié)合,既要簡(jiǎn)單干練又要和業(yè)務(wù)強(qiáng)相關(guān),既要篩選便捷又要方便進(jìn)一步操作。用戶(hù)畫(huà)像需要堅(jiān)持三個(gè)原則,分別是人口屬性和信用信息為主,強(qiáng)相關(guān)信息為主,定性數(shù)據(jù)為主。下面就分別展開(kāi)進(jìn)行解釋和分析。
1、信用信息和人口屬性為主
描述一個(gè)用戶(hù)的信息很多,信用信息是用戶(hù)畫(huà)像中重要的信息,信用信息是描述一個(gè)人在社會(huì)中的消費(fèi)能力信息。任何企業(yè)進(jìn)行用戶(hù)畫(huà)像的目的是尋找目標(biāo)客戶(hù),其必須是具有潛在消費(fèi)能力的用戶(hù)。信用信息可以直接證明客戶(hù)的消費(fèi)能力,是用戶(hù)畫(huà)像中最重要和基礎(chǔ)的信息。一句戲言,所有的信息都是信用信息就是這個(gè)道理。其包含消費(fèi)者工作、收入、學(xué)歷、財(cái)產(chǎn)等信息。
定位完目標(biāo)客戶(hù)之后,金融企業(yè)需要觸達(dá)客戶(hù),人口屬性信息就是起到觸達(dá)客戶(hù)的作用,人口屬性信息包含姓名、性別,電話號(hào)碼,郵件地址,家庭住址等信息。這些信息可以幫助金融企業(yè)聯(lián)系客戶(hù),將產(chǎn)品和服務(wù)推銷(xiāo)給客戶(hù)。
2、采用強(qiáng)相關(guān)信息,忽略弱相關(guān)信息
我們需要介紹一下強(qiáng)相關(guān)信息和弱相關(guān)信息。強(qiáng)相關(guān)信息就是同場(chǎng)景需求直接相關(guān)的信息,其可以是因果信息,也可以是相關(guān)程度很高的信息。
如果定義采用0到1作為相關(guān)系數(shù)取值范圍的化,0.6以上的相關(guān)系數(shù)就應(yīng)該定義為強(qiáng)相關(guān)信息。例如在其他條件相同的前提下,35歲左右人的平均工資高于平均年齡為30歲的人,計(jì)算機(jī)專(zhuān)業(yè)畢業(yè)的學(xué)生平均工資高于哲學(xué)專(zhuān)業(yè)學(xué)生,從事金融行業(yè)工作的平均工資高于從事紡織行業(yè)的平均工資,上海的平均工資超過(guò)海南省平均工資。從這些信息可以看出來(lái)人的年齡、學(xué)歷、職業(yè)、地點(diǎn)對(duì)收入的影響較大,同收入高低是強(qiáng)相關(guān)關(guān)系。簡(jiǎn)單的將,對(duì)信用信息影響較大的信息就是強(qiáng)相關(guān)信息,反之則是弱相關(guān)信息。
用戶(hù)其他的信息,例如用戶(hù)的身高、體重、姓名、星座等信息,很難從概率上分析出其對(duì)消費(fèi)能力的影響,這些弱相關(guān)信息,這些信息就不應(yīng)該放到用戶(hù)畫(huà)像中進(jìn)行分析,對(duì)用戶(hù)的信用消費(fèi)能力影響很小,不具有較大的商業(yè)價(jià)值。