谷歌的人工智能部門DeepMind之前幫助AlphaGo擊敗圍棋大師?,F(xiàn)在DeepMind透露,它已經(jīng)研發(fā)了新款AI,這款被稱為WaveNet的AI,是一種深層神經(jīng)網(wǎng)絡,可以通過對人類語音進行實時采樣形成原始音頻波形,從而最終創(chuàng)造一些機器所能達到的,最接近于真人的語音。
英語用戶和普通話用戶測試發(fā)現(xiàn),WaveNet性能已經(jīng)比現(xiàn)有的文本到語音系統(tǒng)更好,但仍然缺乏讓用戶認為是真人講話的說服力。WaveNet,采用真人語音輸入,但學習和模仿這些人的講話,WaveNet可以捕捉不同用戶的聲音,并且模擬他們的身份和說話語調。
同樣令人印象深刻的是,WaveNet甚至可以模擬人類說話時候嘴部氣流產(chǎn)生的雜音,以及模擬語調,情感和口音。不過現(xiàn)在距離谷歌正式推出WaveNet還有很長的道路要走。