Sythesizable 綜和再生,機(jī)器變成人
每天醒來,你喚的第一個(gè)名字叫做 Alexa,每天睡去,最后一聲念叨的是 Siri,基于人工智能的語音綜合(speech synthesis)已經(jīng)成為了我們生活中不可缺少的一部分。甚至,未來的騷擾、詐騙電話都會(huì)用到 AI Sythesize 技術(shù)。
Reference: L. Deng, Microsoft Chatbot Talk
可以被綜合的難道僅僅是語音么?Chatbot 們已經(jīng)學(xué)會(huì)用自然語言調(diào)戲人類,新一代美顏濾鏡會(huì)造出以一個(gè)個(gè)印象派的蒙娜麗莎,自動(dòng)駕駛的車輛們,直接生成方向盤指令?;?Policy Evaluation 的增強(qiáng)學(xué)習(xí)(Reinforcement Learning)已經(jīng)革多少人的命?更勿論,生成對抗學(xué)習(xí)的大 boss 已經(jīng)磨刀霍霍向豬羊。
所以硬件創(chuàng)業(yè)者們,classification/inference 的年代早已隨歲月順?biāo)鳎磥淼挠布臋C(jī)遇已經(jīng)超越了理解人類的范疇。這將是一個(gè)機(jī)器能與人溝通的年代。以綜合(synthesis)為目標(biāo)的人工智能硬件正向我們走來。
Savable 從頭開始,你就輸了
總是改變生態(tài)的 G 家大神總在你意想不到的給大家送福利。比如正式出版的 Tensorflow 1.0 提供了不少基于圖片識(shí)別的預(yù)訓(xùn)練(pre-trained)網(wǎng)絡(luò),基于 Inception 結(jié)構(gòu)。對于很多智能開發(fā)者而言,只需要根據(jù)實(shí)際情況,對最后一到兩層的全鏈接(Fully connected layer)訓(xùn)練下,就能達(dá)到玩美智能的效果。高效、省時(shí)、省力、省硬件。
同樣的故事發(fā)生在 Baidu 和 Amazon 的語音識(shí)別系統(tǒng)中。大家不約而同的發(fā)現(xiàn),對于不同語言的識(shí)別系統(tǒng),其實(shí)只要訓(xùn)練輸出層(output layer)就能得到相近的結(jié)果。而省去 RNN/CNN 層訓(xùn)練就好像是時(shí)間的饋贈(zèng),來自上天的禮物。