講一下人工智能具體包括哪些東西。這個(gè)問(wèn)題原來(lái)在這篇上寫了一個(gè)“百度大腦”,因?yàn)樽钤缇褪俏以趦蓵?huì)上提過(guò)中國(guó)大腦的概念,后來(lái)我說(shuō)咱們自己開始先做百度大腦。百度大腦包括什么東西?就包括這四個(gè)東西,昨天我看到騰訊搞了一個(gè)活動(dòng)叫“云+未來(lái)峰會(huì)”,他們想象的人工智能的布局,其實(shí)講的也是這四方面,后來(lái)我就把“百度大腦”這個(gè)詞去掉,既然現(xiàn)在大家都認(rèn)為人工智能是這些東西,那我們就把它作為一個(gè)行業(yè)通用認(rèn)可的做法來(lái)描述。
這些其實(shí)不是學(xué)術(shù)界認(rèn)可的分類方法,更像是從工業(yè)的角度看,什么東西是更有市場(chǎng)影響力的。什么東西呢?語(yǔ)音識(shí)別的技術(shù)。一方面它是通用技術(shù),另外一方面它是具體應(yīng)用的。圖像識(shí)別的技術(shù),也包括視頻識(shí)別,在學(xué)術(shù)界把它叫做計(jì)算機(jī)視覺(jué)。自然語(yǔ)言處理的技術(shù),最早提出的圖靈實(shí)驗(yàn),就是說(shuō)你人說(shuō)一句話,機(jī)器能不能明白你在說(shuō)什么?自然語(yǔ)言有一些叫NLP,自然語(yǔ)言處理,有些叫NLU,自然語(yǔ)言理解,這是一個(gè)意思。還有一個(gè)用戶畫像,用戶畫像這個(gè)說(shuō)法實(shí)際上是在去年夏天提出的,之前沒(méi)有的。去年夏天在硅谷和一些科學(xué)家討論過(guò)人工智能,討論百度大腦到底該包括什么東西?我們討論出來(lái)說(shuō)用戶畫像還是很重要的一部分,原因就是,人工智能本質(zhì)上就是讓機(jī)器懂人,明白人在講什么,是什么意思?機(jī)器要想懂人的話,它得對(duì)這個(gè)用戶有一個(gè)畫像,有一個(gè)了解,所以我們認(rèn)為這個(gè)東西是一個(gè)很重要的東西。
恰好,作為一個(gè)互聯(lián)網(wǎng)公司,我們能夠收集到大量用戶的數(shù)據(jù)是可以把這個(gè)畫像畫出來(lái)的,畫出來(lái)以后,怎么去理解它,這個(gè)是非常有意義的,理解是個(gè)很重要的大的方向。講一下圖像識(shí)別,圖像識(shí)別最好的講法就是給大家看一段視頻。這是浙江衛(wèi)視搞的一檔叫《最強(qiáng)大腦》的節(jié)目,展示了一下百度的圖像識(shí)別能力。
【播放《最強(qiáng)大腦》視頻:小度和人類“腦王”的人機(jī)大戰(zhàn)】
所以大家看到,人辨別不出來(lái)的差別,人工智能可以辨別出來(lái),所以它在某些特定的領(lǐng)域經(jīng)過(guò)一定的訓(xùn)練,它的能力是超過(guò)人的,所以這是一個(gè)比較典型的用人臉識(shí)別、圖像識(shí)別技術(shù),識(shí)別出來(lái)哪一張臉對(duì)應(yīng)哪一個(gè)人的這么一個(gè)展示。
語(yǔ)音識(shí)別其實(shí)現(xiàn)在應(yīng)用也比較廣泛,大家平時(shí)使用百度搜索的話,你說(shuō)話語(yǔ)音識(shí)別也可以很容易地去理解。這邊也給大家做一個(gè)演示,是百度的輕聲輸入。語(yǔ)音識(shí)別經(jīng)歷了幾個(gè)階段,最早大概三四年前,剛剛有語(yǔ)音識(shí)別的時(shí)候,我們?cè)谌齺喍燃俚臅r(shí)候,有個(gè)朋友講我們可以語(yǔ)音識(shí)別,當(dāng)時(shí)在一個(gè)餐館里頭,背景噪音很大,操作以后發(fā)現(xiàn)不行,平時(shí)在安靜的環(huán)境下可以識(shí)別出來(lái),到噪音環(huán)境下就識(shí)別不出來(lái)?,F(xiàn)在不僅噪音環(huán)境下可以,今天演示的這個(gè),你說(shuō)話聲音很輕的時(shí)候它也可以。
【展示百度輕聲識(shí)別案例】
大家也看到,聲音越來(lái)越小了,其實(shí)我們?nèi)艘呀?jīng)聽(tīng)不見(jiàn)它在說(shuō)什么了,但機(jī)器能聽(tīng)見(jiàn)。事實(shí)上,在搜索的場(chǎng)景下,人的聽(tīng)力,人的識(shí)別率,就是整個(gè)一句話都能一字不錯(cuò)聽(tīng)出來(lái)的(比例),是82%,機(jī)器現(xiàn)在做到87%,在這種單向的能力上,它經(jīng)過(guò)訓(xùn)練是可以超過(guò)人的。我們?cè)?jīng)不習(xí)慣,所以老是覺(jué)得我要慢點(diǎn)說(shuō),其實(shí)沒(méi)關(guān)系,你以為它聽(tīng)不明白,它現(xiàn)在都能聽(tīng)明白了。自然語(yǔ)言處理很多時(shí)候也是基于語(yǔ)音的識(shí)別,語(yǔ)音識(shí)別是什么呢?你說(shuō)的這句話到底對(duì)應(yīng)的是哪幾個(gè)字。但是這幾個(gè)字是什么意思,這背后是另外一種技術(shù),叫做自然語(yǔ)言處理。
這里給大家講一個(gè)應(yīng)用,叫金牌銷售,這個(gè)是什么呢?百度也有一個(gè)比較龐大的銷售團(tuán)隊(duì)跟中小企業(yè)進(jìn)行對(duì)接,這個(gè)團(tuán)隊(duì)只憑一個(gè)銷售去負(fù)責(zé),其實(shí)不是很靠譜,因?yàn)槿藛T流動(dòng)性很大,每次新的銷售人員進(jìn)來(lái)之后要重新進(jìn)行培訓(xùn),而老的有經(jīng)驗(yàn)的、優(yōu)秀的銷售,他們出單的能力比新的銷售要強(qiáng)很多。后來(lái)我們想說(shuō),既然老的銷售這么厲害,那我們用機(jī)器學(xué)他,學(xué)他應(yīng)對(duì)客戶的技巧,然后放入工具給新的銷售,當(dāng)你給客戶打電話的時(shí)候,客戶問(wèn)什么,我們用計(jì)算機(jī)馬上識(shí)別出來(lái)客戶問(wèn)的是什么問(wèn)題,然后理解這個(gè)問(wèn)題,最后把最優(yōu)秀的銷售員回答這個(gè)問(wèn)題的答案呈現(xiàn)在電腦屏幕上,告訴新的銷售,那么新的銷售等于直接照著屏幕念就行了。這樣的一種做法就是我們?cè)诒鄙蠌V深四個(gè)城市的百度的銷售團(tuán)隊(duì)現(xiàn)在都已經(jīng)實(shí)現(xiàn)了,成單率整體提升10%,效果還是非常非常明顯的。而這里頭就不是簡(jiǎn)單的語(yǔ)音識(shí)別說(shuō)我知道客戶問(wèn)的是哪幾個(gè)字,它得理解客戶的問(wèn)題到底是什么問(wèn)題,然后再去找最優(yōu)秀的銷售回答這個(gè)問(wèn)題是怎么回答的,與此同時(shí),我們也利用對(duì)于客戶的畫像來(lái)有針對(duì)性地定制相應(yīng)的答案。