在物聯(lián)網(wǎng)和人工智能時(shí)代,產(chǎn)品的智能化已經(jīng)成為趨勢。從電子產(chǎn)品、家電到家居用品,智能的概念在前兩年大行其道。智能家居和可穿戴的風(fēng)口從2014年開始井噴,但這種勢頭在2015年下半年,卻開始放緩。
于是,我們能對比到,現(xiàn)在大多數(shù)人的智能家居和硬件產(chǎn)品,還離我們想象中的“智能”非常遙遠(yuǎn)。只在硬件上加上一個(gè)WiFi、傳感器和APP,這并不是我們期待的“智能化”的未來。
最像“智能”的產(chǎn)品,或許是亞馬遜的Echo。它整合了Alexa語音識別技術(shù),讓消費(fèi)者用聲音上網(wǎng)、檢索信息、控制家居生活,已經(jīng)擁有300萬臺(tái)的銷量,讓谷歌都為之眼饞。它體現(xiàn)的價(jià)值,也集中在搜索、伺服式語音識別和人工智能之上。
一個(gè)新的交互形態(tài),在智能家居和硬件之上正亟需提高。當(dāng)我們使用上述的智能化場景時(shí),無論是可穿戴設(shè)備,還是家居、家電,如果仍然靠PC或智能手機(jī)的界面來操作,這可能是很難想象的。
不依托于這些手動(dòng)裝置,就能實(shí)現(xiàn)對它們的操控,無疑是這些設(shè)備最吸引人的便捷性所在。語音交互,也成為智能化過程中日益普遍的一項(xiàng)功能。
“交互的形態(tài)正在改變。”云知聲CEO黃偉說。“移動(dòng)互聯(lián)網(wǎng)和PC互聯(lián)網(wǎng)時(shí)代最大的區(qū)別是,我們現(xiàn)在是基于多點(diǎn)觸控的應(yīng)用,用手機(jī)上網(wǎng),用移動(dòng)設(shè)備上網(wǎng),而不是僅僅用PC,通過鍵盤。而到了IOT時(shí)代,我們又不再只是通過手機(jī),我們可以通過更多的設(shè)備聯(lián)網(wǎng),而它可能不再有觸摸屏。”
從家居到家電,從物流到駕駛,從醫(yī)療到娛樂,一個(gè)智能的趨勢正席卷而來。從Siri、小冰,到Echo,到搜狗的語音輸入,再到度秘。也許人工智能的發(fā)展進(jìn)程我們還不能預(yù)判,但商業(yè)和生活的智能化,卻已經(jīng)是一個(gè)不可逆轉(zhuǎn)的過程。而其中,語音交互,或許會(huì)是一個(gè)新的智能時(shí)代的新入口。
本站在云知聲的體驗(yàn)間里,體驗(yàn)了樂視超級電視X55和華帝抽油煙機(jī),如何在家庭場景噪聲下喚醒和操控。通過語音的控制,窗簾可以自動(dòng)開啟,燈光可以調(diào)節(jié)。創(chuàng)業(yè)4年,累計(jì)融資近億美元之后,云知聲,也許在物聯(lián)網(wǎng)和人工智能興起的浪潮中,也將面對一個(gè)更大的發(fā)展時(shí)機(jī)。

云知聲CEO黃偉/受訪者供圖
物聯(lián)網(wǎng)智能硬件要和服務(wù)打通
2008年,科大訊飛上市,一度壟斷國內(nèi)語音識別市場的半壁江山。深度學(xué)習(xí)的發(fā)展,給了語音識別新的驅(qū)動(dòng)力,但在2012年,云知聲初成立之時(shí),在這片江湖中,玩家還是寥寥無幾。如何實(shí)現(xiàn)彎道超車?當(dāng)時(shí)云知聲,決心從開發(fā)者平臺(tái)做起。
在當(dāng)年,許多公司的創(chuàng)業(yè)方向都還是語音助手APP。“但我并不認(rèn)為這個(gè)方向能夠成功,尤其說它根本不適合一個(gè)創(chuàng)業(yè)公司去做,做這個(gè)就是死路一條。”黃偉說。
黃偉的判斷來源于自己多年來的從業(yè)經(jīng)驗(yàn)。作為語音識別的領(lǐng)軍人物之一,他先后就職于摩托羅拉和盛大創(chuàng)新院,曾成立盛大創(chuàng)新院語音分院,在2012年,黃偉離開盛大。“我自己做過很多年的技術(shù),我非常清楚,語音其實(shí)是技術(shù),并不是產(chǎn)品。它是用來解決人跟設(shè)備的交互問題的,但交互本身不是目的,人們是要通過一種最便捷的方式來獲得后面的服務(wù)。就像手機(jī)的多點(diǎn)觸控,你離不開屏幕,但你覺得只有這塊屏幕好玩嗎?當(dāng)然不是,吸引你的,是它背后的各種互聯(lián)網(wǎng)服務(wù)。”Echo之所以成功,不僅是它的語音交互,還是由于,它可以和亞馬遜電商打通,可以直接提供服務(wù)。
但是,對于創(chuàng)業(yè)公司而言,它也往往只限于提供這種交互方式本身,是很難具備連接交互后面服務(wù)的能力的。“當(dāng)時(shí)選擇做平臺(tái),是因?yàn)檫@樣至少我們是有技術(shù)價(jià)值的。”黃偉總結(jié)。2012年9月,云知聲語音平臺(tái)發(fā)布,當(dāng)時(shí)的精確度只有85%。
但是,語音平臺(tái)也為云知聲源源不斷積累了語音數(shù)據(jù)。2013年初,準(zhǔn)確度提高到了91%;而到了2013年底,云知聲的語音數(shù)據(jù)已經(jīng)積累到3000小時(shí),精確度提高到95%,平臺(tái)上開發(fā)者超過8000家。
從那時(shí)起,數(shù)據(jù)+算法就成為云知聲“雙門驅(qū)動(dòng)”的引擎。從一開始,云知聲就和深度學(xué)習(xí)結(jié)合在一起。當(dāng)時(shí)的深度學(xué)習(xí)還主要是停留在學(xué)術(shù)界,很多人對此了解并不多,而深度學(xué)習(xí),也需要超過以往不同數(shù)量級的數(shù)據(jù)支撐。但在2011年,在一個(gè)語音識別的國際會(huì)議上,黃偉遇到了微軟首席研究員俞棟,對方告訴黃偉,這是“確確實(shí)實(shí)進(jìn)展非常快、能夠取得非常大的成就”的。