2016年8月,美的智能空調(diào)發(fā)布,它搭載了云知聲的AI芯,使用者可以在家庭環(huán)境中5米內(nèi)通過語音控制空調(diào)的開關(guān)和溫度,空調(diào)能結(jié)合關(guān)鍵詞分析、理解用戶意圖。
但這款產(chǎn)品的問世也是歷經(jīng)挑戰(zhàn)。要想獲得廠商的合作支持,就必須能夠消除噪聲環(huán)境影響實現(xiàn)語音控制;空調(diào)一般都是壁掛式,所以要實現(xiàn)遠場交互;且成本可控。
“Echo是7+1個麥克風,外圈7個和中間1個,所以它效果不錯。但我不行,家電廠商對成本是非常在意的。”黃偉說。“麥克風多了,信息源多,就需要更強的CPU,成本功耗就要提升。其次,家電大多是靠墻安裝的,麥克風怎么放?”
云知聲最后采用的是雙麥克解決方案,兩個麥克風,間距不超過3厘米。但問題又來了,只有兩個麥克,如何達到性能?云知聲花了一年多時間解決這個技術(shù)問題,終于在2015年這款產(chǎn)品開始生產(chǎn)。現(xiàn)在,市場上的大多數(shù)智能家電產(chǎn)品,華帝、格力、海爾、美的等,都是和云知聲合作的。
但軟件可解決,硬件也還是讓黃偉覺得比較麻煩的一件事。比如麥克風。“現(xiàn)在手機上的麥克風,對電話場景下的噪音意識,已經(jīng)做得非常好了。但在家居市場上,硬件廠商還沒有這個意識。比如他們以前從來不會想到,一臺電冰箱上會需要一個麥克風。所以,現(xiàn)在對我們軟件的要求就更高了。”
除了智能家電和家居,車載以及醫(yī)療、教育等行業(yè),也是云知聲商業(yè)化落地的主要領(lǐng)域。比起智能家居來,車載的應用場景更好想象。當人們在駕駛時,雙手都被占用,語音交互就成了最佳選擇。但黃偉認為,車載前端產(chǎn)品周期非常長,“從接觸到產(chǎn)品要出來差不多要用5年左右時間,不適合一個創(chuàng)業(yè)公司”。因此,云知聲選擇從后裝市場切入。而2014年,黃偉認為是一個新的契機正在出現(xiàn):“當時已經(jīng)有10%的設(shè)備開始使用安卓平臺了。我們判斷,安卓在車載系統(tǒng)里將是未來的趨勢。”經(jīng)過了半年多的研發(fā),到2015年中,云知聲開始和廠商對接。到現(xiàn)在,安卓系統(tǒng)已經(jīng)占據(jù)了市場上90%的份額,而目前,搭載云知聲智能語音SDK的車機產(chǎn)品出貨量已超過150萬臺。
在醫(yī)療方面,協(xié)和醫(yī)院已經(jīng)和云知聲合作,使用醫(yī)療語音識別系統(tǒng),對病歷、醫(yī)囑等進行錄入。而且,這也有助于未來的醫(yī)療大數(shù)據(jù)挖掘工作。
在商業(yè)化的策略上,云知聲一直選擇的是B2B2C。這也是很多AI公司的選擇。當一種新技術(shù)仍在發(fā)展和完善過程中,通過與B端的合作,不斷獲取用戶的需求,了解行業(yè),通過反復迭代來完善技術(shù),是看似必然的選擇。而B端的企業(yè),也是在技術(shù)投入成本較大的現(xiàn)階段,比C端更具備付費與創(chuàng)新的動力。
之前,云知聲的合作公司還多數(shù)是互聯(lián)網(wǎng)公司的中小型企業(yè),而從2016年開始,公司的商業(yè)重心開始向大B傾斜。“對于中小型公司而言,新的技術(shù)和交互形態(tài)它們更樂于去嘗試。而大企業(yè)的推動進程也比較慢。而今年,很多大的企業(yè)的生產(chǎn)計劃也可以排好了。”而和大型企業(yè)合作,對云知聲而言,既能擴大市場規(guī)模,又能樹立起行業(yè)中的標桿。
“做商業(yè)公司,一定得回歸到商業(yè)本質(zhì)上,那就是收入。尤其是像今天資本市場并不是特別好的情況下,大家更看重收入。但我們并不是到B為止了,我們還會到C。我們?yōu)槭裁匆銎脚_?C端對我們具有用戶價值,這能幫助我們的后臺不斷提升,在B端會更有持續(xù)的競爭力。”黃偉說。

云知聲醫(yī)療語音識別系統(tǒng)的應用/受訪者供圖
讓機器去理解人類
而這樣用語音操控機器,或者機械的一問一答,還是遠遠達不到“智能”的程度的。開發(fā)者們需要去做的,是讓它們更加聰明。
如果你坐進自己的愛車,感覺到今天的溫度有些低,于是你說:今天有些冷。而這時,你車內(nèi)的系統(tǒng)會自動將空調(diào)溫度調(diào)高。再或者,當你和你的機器人在戶外,你仍然隨口表示:今天有些冷。而機器人,會自動理解你的意思,但此時,它不會去尋找空調(diào),而是提示你:披上外套吧。這樣的,是不是更令人向往的一個美好未來?
今年7月,云知聲宣布,完成了技術(shù)引擎3.0版本的升級,并提出了“語用計算”的概念。關(guān)于這個概念,你可以簡單地理解成,機器可以理解我們對話的語境,聯(lián)系上下文進行回答。