這些詞向量具有一個特點,它的緯度是固定的,避免了傳統(tǒng)空間向量模型當(dāng)中維數(shù)災(zāi)難的問題。由于我們已經(jīng)用詞匯向量表示一個詞匯的含義,向量之間又是可以加起來的,所以我們在大量文本的背后可以分析出潛在的語言學(xué)的規(guī)律,最典型的例子是國王-皇后等于男人-女人。
在實際運用中是不是有比較好的表現(xiàn)呢?我們做了一些嘗試,最后有一些定律定義詞匯之間語義的相關(guān)性。從這個例子當(dāng)中看到效果還是不錯,對ATM這個語義最相近的詞匯有ATM機、取款機、自動取款機、柜員機、自助機。還有“好”這個詞語義最相近的比如溫柔、利索、忙前忙后、謙虛、和藹可親。可以看到Word2Vec是有一個比較好的表現(xiàn)。
進一步看一下Word2Vec能不能幫助我們的業(yè)務(wù)要素找到最靠譜的平臺概念。做一個嘗試,有三個比較常用的業(yè)務(wù)對象,包括短信、柜員和保險,設(shè)置了一組評價概念的詞匯,通過Word2Vec找到了這些概念和評價詞匯之間的相似度,標(biāo)紅的部分是明顯高于其它的連接方式的。
能夠看到短信連接到漏發(fā)、錯發(fā)、詐騙,柜員可以連接到怠慢、欺騙、誤導(dǎo),保險可以連接到欺騙、詐騙和誤導(dǎo),這確實能夠有效幫助我們輔助人工做梳理,縮短整個模型構(gòu)建的周期。
客戶意見挖掘——實施效果
既然有了客戶意見表示方式,接下來應(yīng)用于什么業(yè)務(wù)場景當(dāng)中。首先把客戶個體意見和客戶星級數(shù)據(jù)做關(guān)聯(lián),這樣就能看到不同星級之間的客戶關(guān)心的不同問題在哪里,其中我們看到像七星級客戶和三星級客戶關(guān)注的問題有非常大的差異,其中還有五星級客戶甚至成為一個孤島,和其它類型的客戶關(guān)注的點都是完全不同的,從中我們可以制定針對于高星級客戶的差異化的服務(wù)策略的提升。
第二個問題是關(guān)聯(lián)的問題,比如優(yōu)盾的問題,通過關(guān)聯(lián)分析就知道哪個品牌的優(yōu)盾關(guān)聯(lián)到哪個問題是最多的,形成關(guān)聯(lián)網(wǎng)絡(luò),從這個圖上能夠針對性的制定產(chǎn)品改進的措施。
第三個例子是連續(xù)投訴分析,同一個客戶在很短的時間內(nèi)針對同一個問題反復(fù)投訴的情況,有這個分析結(jié)果以后有兩個方面可以利用,首先我們可以知道哪些問題是客戶最不能容忍的,一旦沒有給他很好的得到解決的話他會反復(fù)投訴,增加我們的投訴量。
另一方面也能夠知道工商銀行在哪些問題上的解決是比較欠缺的,由于工商銀行沒有到位導(dǎo)致客戶進一步的投訴。還可以看到客戶意見地域上的分布,隨著時間的變化這些意見會得到什么樣的趨勢性的發(fā)展。把這些緯度進行相互結(jié)合可以得到更加靈活的分析結(jié)果,比如說在上半年上海高星級客戶,增長最快的客戶意見有哪些。
如何聆聽互聯(lián)網(wǎng)客戶的心聲
接下來講講如何聆聽互聯(lián)網(wǎng)客戶的心聲。工商銀行非常關(guān)注于行內(nèi)官方途徑的反饋,也特別注意互聯(lián)網(wǎng)上客戶傳播的心聲,我們建立了互聯(lián)網(wǎng)客戶心聲聆聽系統(tǒng),能夠覆蓋到互聯(lián)網(wǎng)上各類新聞網(wǎng)站和社交網(wǎng)絡(luò)渠道,對我們所關(guān)注的信息做自動化收集,在我們得到信息之后會做多緯度的分類,看這些信息都是關(guān)于什么銀行的,提到了哪一類業(yè)務(wù)和產(chǎn)品,打上什么標(biāo)簽,完成打標(biāo)簽之后跟行內(nèi)的信息也做一個更好的關(guān)聯(lián)。
由于我們主要關(guān)注互聯(lián)網(wǎng)上所關(guān)注的投訴,在大量信息當(dāng)中識別負(fù)面評價,當(dāng)一個比較重大的事件發(fā)生的時候會有一個傳播特征的分析,去看這個事件首發(fā)在什么網(wǎng)站,什么時候發(fā)生的,經(jīng)過什么樣的傳播途徑和轉(zhuǎn)載關(guān)系之后達到爆發(fā)的頂峰,它又是怎么樣慢慢消退的,最后在一些重要事情發(fā)生的時候可以做及時預(yù)警。