但這個事情本質(zhì)上還是一維問題,就是從聲音到文字,所以也相對較容易為人工智能技術(shù)解決。去年機器學(xué)習(xí)的發(fā)展使整個語音識別有了較大飛躍。
之前整個語音識別技術(shù)還沒有到特別實用的階段,但是今天在一些垂直領(lǐng)域,比如有些導(dǎo)航地圖,因為POI(Point ofInterest,信息點)可能就是那么幾十萬個,所以容易基于某地理位置加上之前提高了準確率的模型,再來識別,準確率就會大大提高。
包括有些購物網(wǎng)站,因為它的SKU(Stock Keeping Unit,庫存量單位)數(shù)盡管多,但也相對有限,所以通過語音搜索的準確率也容易大大提高。
這些都相當(dāng)于在之前技術(shù)進步的基礎(chǔ)上,加上行業(yè)應(yīng)用,到目前已經(jīng)達到了民用級的階段,我相信可能在不久的將來,在這個領(lǐng)域可能也會有一個比較好的突破。
在語音識別領(lǐng)域,很可能大公司的技術(shù)積累,會比創(chuàng)業(yè)公司好很多,所以可以說給創(chuàng)業(yè)型公司留的機會相對來講要少一些。但還是能舉出例子來,像科大訊飛就是做語音做起來的,也做得非常好,又比如云知聲,一直做語音服務(wù),做得也還可以。就看時間會給它們留多少來跟巨頭競爭。
語音的通用問題有可能還是大公司解決得比較好,創(chuàng)業(yè)公司相對比較難,但它可以在一些具體領(lǐng)域?qū)崿F(xiàn)突破,比如在一些具體行業(yè)里,有一些行業(yè)專屬庫,涉及特珠的詞或特珠的交流方式。但在通用型應(yīng)用上基本是大公司的事情。
現(xiàn)在我們輸入還是需要鍵盤,說明這個問題還沒有很好地解決。什么時候我們輸入不用鍵盤了,直接用語音來輸入,這個時候才說明到實用程度了。但是現(xiàn)在技術(shù)才剛剛開始,找到具體的應(yīng)用點非常重要。如果能把這件事情做到足夠成熟和產(chǎn)品化,是件巨大的事情。因為這相當(dāng)于掌握了輸入入口,這也是大公司必爭之地。
2.圖像識別:找到接受目前成本結(jié)構(gòu)和服務(wù)方式的方向
人工智能取得進展的第二個領(lǐng)域是圖像識別。
圖象基本上是人接收消息最快的方式,在微信里聽語音可能要15秒,但是看字的話,有可能掃一眼就差不多了,因為它是二維的,你甚至可以說是有縱軸、橫軸,甚至還有深度信息,其實它的信息獲取效率是非常直觀且非??斓?。
當(dāng)時關(guān)注到圖像識別,很大程度上也是因為當(dāng)時香港中文大學(xué)湯曉鷗教授一篇論文,說在他們限定的測試結(jié)果集上,計算機對人臉的識別已經(jīng)開始超過了人眼,這件事說明在某些特定的領(lǐng)域,機器識別已經(jīng)開始可以跟人相媲美了。
我們現(xiàn)在看到圖像識別在一些ToB應(yīng)用上會相對多一些,比如監(jiān)控,包括在一些人跟證件照的比對上。但同時我們也發(fā)現(xiàn),有很多To C的應(yīng)用出來。
比如臉萌推出的Faceu,它的技術(shù)是由商湯集團提供的。也就是說機器在識別人臉之后,未必做的都是很嚴肅的事情,還可以做一些好玩的,比如畫畫眉毛涂涂腮紅。這樣我們看到其實現(xiàn)在很多娛樂領(lǐng)域里,人臉識別也得到了應(yīng)用。又比如現(xiàn)在有云相冊,可以按照人的歸類使照片按人分享變得更容易:大家出去游玩拍照片,云相冊可以自動識別人臉在后臺將所有照片做好分類,只有點擊一下,便可以直接按照人臉分別分享出去。
可以看到這些更偏娛樂化或?qū)嵱没腡o C方向應(yīng)用,也是很好的方向。未來可能還會有更多更好的跟技術(shù)相關(guān)驅(qū)動的應(yīng)用出現(xiàn)。
關(guān)于圖像識別我目前有兩個判斷:一是產(chǎn)品上已經(jīng)開始接近成熟,二是它剛剛邁到走向成熟的這個坎。換句話說,在一些算法、效率,以及降低成本方面,還有一些改進空間。而且關(guān)于深度學(xué)習(xí),其實從出現(xiàn)到現(xiàn)在,從學(xué)術(shù)研究上也有不少值得研究和突破的地方,而且改進的空間可能還挺大。
另外,圖像識別還是需要找到一些可以接受目前成本結(jié)構(gòu)和服務(wù)方式的方向。比如在監(jiān)控方面的應(yīng)用,尤其是人員流量大的地方,像比利時爆炸案,跟公共安全相關(guān)的地方有很強的需求。
最后就是我們身邊的智能設(shè)備,具有一些簡單計算的能力,比如在拍攝時自動識別關(guān)鍵位置和關(guān)鍵的人,或著做人臉追蹤,自動調(diào)整角度。這些都是很好的應(yīng)用,如果能從這些角度展開,商業(yè)機遇也不校