人工智能、虛擬現(xiàn)實(shí)技術(shù),將對(duì)未來(lái)帶來(lái)怎樣的改變?上周六,計(jì)算機(jī)與信息科學(xué)領(lǐng)域?qū)<依跤阑?、葉士青做客廣東科學(xué)中心與南方都市報(bào)共同主辦的小谷圍科學(xué)講壇,用各種視頻、圖文資料向聽(tīng)眾們介紹了人工智能、虛擬現(xiàn)實(shí)技術(shù)的前沿研究和應(yīng)用領(lǐng)域開(kāi)發(fā)成果,還回答了聽(tīng)眾們的各類問(wèn)題。對(duì)于機(jī)器人覺(jué)醒、犯罪的話題,專家表示關(guān)鍵還是在人,人可以把機(jī)器人做得很好、服務(wù)人,也可以把機(jī)器人做成殺人的機(jī)器。
栗永徽
人工智能的應(yīng)用:AI能跟人說(shuō)話、幫人開(kāi)車
栗永徽是臺(tái)灣資訊工程學(xué)系助理教授,美國(guó)卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)院語(yǔ)言學(xué)習(xí)研究所博士,他介紹了人工智能領(lǐng)域的科研和應(yīng)用開(kāi)發(fā)進(jìn)展。人工智能也是靠“學(xué)習(xí)”來(lái)增加智慧的,“比方說(shuō),你把各種動(dòng)物的照片喂給它,它的深度學(xué)習(xí)引擎核心就會(huì)讀這些照片,分析里面的特定結(jié)構(gòu),找出共有特征,比如貓都會(huì)有兩只耳朵、有胡須,眼睛很亮,下次看到類似圖片時(shí),它會(huì)說(shuō),這是一只貓”。
美圖軟件也是人工智能
栗永徽介紹,現(xiàn)在的人工智能主要是靠大量資料輸入算法,由算法自動(dòng)歸納、建模,來(lái)獲得深度學(xué)習(xí)的能力,基本上都可以看作一個(gè)數(shù)學(xué)函數(shù)。比如語(yǔ)音識(shí)別,就是輸入一堆語(yǔ)音信號(hào),訓(xùn)練這個(gè)函數(shù),使它輸出特定的文字符號(hào)。在自然語(yǔ)言處理方面運(yùn)用人工智能,就可以做出實(shí)時(shí)的語(yǔ)音辨析、智能語(yǔ)音助理這樣的產(chǎn)品,比如蘋果的SIRI,還有能跟人“說(shuō)話”的小音箱,人問(wèn)它天氣之類,它可以去網(wǎng)絡(luò)上抓取答案,再回復(fù)給人。再?gòu)?fù)雜一點(diǎn),比如語(yǔ)音訂票系統(tǒng),它會(huì)抓取時(shí)間、地點(diǎn)這樣的關(guān)鍵詞,放進(jìn)交易系統(tǒng)里正確的位置,就能完成一些交易。
把語(yǔ)音換成圖片、視頻之后,人工智能就能做人臉辨識(shí)、指紋辨識(shí)、生物辨識(shí)、物體辨識(shí)這樣的事,像汽車的自動(dòng)駕駛系統(tǒng)、無(wú)人機(jī)送貨這樣的功能就是從中衍生出來(lái)的。國(guó)人熟悉的美妝、美圖軟件,也是從這個(gè)功能中開(kāi)發(fā)出來(lái)的,它需要抓住人臉的特征點(diǎn),還要定位追蹤,越好的技術(shù)抓得越準(zhǔn),人臉在動(dòng)、表情變換快也難不倒它。迪士尼樂(lè)園里也有類似“魔鏡”的游樂(lè)設(shè)施,抓住人臉后給人化妝,做出戲劇效果。
不遠(yuǎn)的將來(lái)
電腦可以聽(tīng)懂人說(shuō)話
游戲中也可以用上這種技術(shù),玩游戲的人在攝像頭前做表情,可以帶動(dòng)游戲中的角色變換表情,與其他玩家溝通。一些零售商家也用得上,比如試戴眼鏡,可以調(diào)整眼鏡的顏色、鏡片的亮度等等,不用在實(shí)體店試太多。大規(guī)模的人臉、物體識(shí)別技術(shù),還可以用在公共場(chǎng)域的監(jiān)控中,比如反恐、維穩(wěn)這類應(yīng)用。先用計(jì)算機(jī)繪圖的方式,讓計(jì)算機(jī)學(xué)習(xí)不同的人走路的樣子、衣服的樣子、顏色等等,學(xué)完后,系統(tǒng)就能實(shí)時(shí)追蹤路上所有行人的行為,即使行人會(huì)互相交錯(cuò),但系統(tǒng)也不會(huì)認(rèn)錯(cuò)人。
栗永徽說(shuō),他自己正在進(jìn)行虹膜辨識(shí)的技術(shù)研究,這種技術(shù)的辨識(shí)準(zhǔn)確度比人臉識(shí)別高很多,“是現(xiàn)在所有生物辨識(shí)技術(shù)里準(zhǔn)確度最高的”。自動(dòng)駕駛技術(shù)是人們比較熟悉的人工智能應(yīng)用,它需要做到對(duì)路邊物體的實(shí)時(shí)辨識(shí),偵測(cè)出地上的交通標(biāo)線,做出駕駛決策。一家快遞公司在用無(wú)人機(jī)送貨,也是屬于人工智能的這種應(yīng)用??傊?,在不遠(yuǎn)的將來(lái),電腦可以聽(tīng)懂人說(shuō)話,可以像人一樣看照片、看圖像、看視頻,并做一些復(fù)雜的事,比如開(kāi)車。“我希望大家思考一個(gè)問(wèn)題,在未來(lái)社會(huì)中,很多勞務(wù)活動(dòng)都可以借助機(jī)器人、人工智能完成。”
葉士青
虛擬現(xiàn)實(shí)的應(yīng)用:人的味覺(jué)還是空白區(qū)
葉士青是復(fù)旦大學(xué)信息科學(xué)與工程院教授,美國(guó)南加州大學(xué)計(jì)算機(jī)科學(xué)博士,他介紹,沉浸感、交互是虛擬現(xiàn)實(shí)技術(shù)的兩個(gè)關(guān)鍵元素,“這跟看電影不一樣,電影沒(méi)有實(shí)時(shí)交互,而虛擬現(xiàn)實(shí)可以偵測(cè)你的動(dòng)作,讓你跟虛擬環(huán)境進(jìn)行實(shí)時(shí)互動(dòng)”。顯示技術(shù)、交互技術(shù)、力反饋技術(shù),都是虛擬現(xiàn)實(shí)幾個(gè)比較關(guān)鍵的技術(shù)。