智慧語音操控基本上夠用,駕駛模式下大部分操控都已經(jīng)實(shí)現(xiàn)了,用的住,同時(shí),希望中興能夠在后續(xù)版本技術(shù)升級(jí)中不斷增加細(xì)粒度,也就是提高智慧語音操控手機(jī)和應(yīng)用的種類、應(yīng)用內(nèi)動(dòng)作等。比如,是否可以在未來通過開放api的方式讓一些經(jīng)常使用的應(yīng)用能夠接入進(jìn)來,比如駕駛模式下語音讀新聞、讀帖子、讀小說應(yīng)用里的小說、讀微信朋友圈文字等等,將整個(gè)手機(jī)操作系統(tǒng)徹底實(shí)現(xiàn)語音操控。
智慧語音的個(gè)性化會(huì)很有趣
內(nèi)嵌的智慧語音現(xiàn)在能夠喚醒并打開使用高德地圖,但是高德地圖有個(gè)名人播報(bào),高德地圖的這個(gè)功能,讓天天見到的地圖應(yīng)用充滿了樂趣和親切感,如果中興也借鑒一下高德地圖的這個(gè)思路會(huì)很有趣。每天名人們給我打開音樂、搜這搜那,讀短信,會(huì)是很拉風(fēng)的一件事兒。
口音識(shí)別的技術(shù)現(xiàn)在做的總體還是不錯(cuò)的,但還需要提升,降噪是一個(gè)思路,智慧語音能識(shí)別口音,是否它能用煙臺(tái)話和我交互呢?目前智慧語音只能把方言識(shí)別成普通話,那么,是否可以逆向思維,輸出方言,從而更容易跟各個(gè)地方的人進(jìn)行交流呢?比如,我的星星手機(jī)起名為“小嫚”,我跟她說“小嫚,過來哈點(diǎn)兒酒吧”,智慧語音估計(jì)很難識(shí)別出來,這個(gè)機(jī)器學(xué)習(xí)是否能夠解決呢?
我還想到一個(gè)有趣的場(chǎng)景,羅永浩一直被稱為手機(jī)界里相聲說的最好的,其實(shí),演講能力大家是都需要的。智慧語音的機(jī)器人可以扮演觀眾,手機(jī)主人面對(duì)觀眾進(jìn)行演講訓(xùn)練,每當(dāng)稍長(zhǎng)停頓就來點(diǎn)鼓勵(lì)或掌聲,讓每一個(gè)人都變成相聲演員,讓靦腆內(nèi)向的人走出封閉,讓孤獨(dú)寂寞的人有一地方宣泄。所以,我覺得語音情景模式和場(chǎng)景細(xì)節(jié)中很多東西,這些可以構(gòu)建出一個(gè)智慧語音產(chǎn)品層面的store,讓社群參與智慧語音的外部研究和應(yīng)用場(chǎng)景研究。
語音操控的更高境界是什么
語音操控的核心就是語言系統(tǒng)和操作系統(tǒng)的無縫整合,語音指令系統(tǒng)和操作系統(tǒng)api的整合統(tǒng)一,在語音模式下,語音指令權(quán)重更高,操作系統(tǒng)的api起到很重要的作用。逆向思維,智慧語音的操控系統(tǒng)同樣也是可以輸出api的,如果以語音操控系統(tǒng)為基點(diǎn),開放語音操控api給手機(jī)app開發(fā)者們,讓各種優(yōu)秀應(yīng)用的操作都能夠接入到語音操控系統(tǒng)里,這樣智慧語音就可以更早一天實(shí)現(xiàn)全語音操控手機(jī)和使用應(yīng)用。
更進(jìn)一步,既然語音操控能夠開放api,那么,就意味著可以進(jìn)行復(fù)雜的api編程,可以根據(jù)算法序列將一個(gè)個(gè)語音指令連續(xù)起來,并且可以接入到工業(yè)機(jī)器人、軍用機(jī)器人、園藝機(jī)器人等身上,從而實(shí)現(xiàn)語音遠(yuǎn)程操控系統(tǒng)。這樣,我們就可以遠(yuǎn)程語音和家里的機(jī)器人管家對(duì)話了,這有點(diǎn)像我們現(xiàn)在正在推進(jìn)智能家居的連接工作。
高級(jí)的語音操控編程在計(jì)算能力支撐之下,可以和人進(jìn)行實(shí)時(shí)地遠(yuǎn)程對(duì)話交流,我軍派出的無人機(jī)在自動(dòng)化戰(zhàn)斗的同時(shí),也可以聽從指揮部或預(yù)警機(jī)空中指揮部直接進(jìn)行語音指揮作戰(zhàn),此時(shí),一言既出,駟馬也能追啦。
登陸|注冊(cè)歡迎登陸本站,認(rèn)識(shí)更多朋友,獲得更多精彩內(nèi)容推薦!