黃:我們還在做基于深度學(xué)習(xí)研究的圖像理解和分類。以及在QQ音樂上的哼唱檢索、類別識別和個(gè)性化推薦。通過分析音樂的信息,識別出歌曲類別,比如流行、搖滾,打上標(biāo)簽。另外通過用戶行為知道他喜歡什么歌,也可以更好的幫他做推薦。
作為大公司背后的技術(shù)團(tuán)隊(duì),優(yōu)圖確定技術(shù)方向的邏輯是什么?
黃:一方面,我們團(tuán)隊(duì)有相當(dāng)大的自主權(quán),在音視頻多媒體大數(shù)據(jù)這個(gè)框架下可以做各種技術(shù)研發(fā)和落地嘗試,老板會支持員工或者團(tuán)隊(duì)做較多嘗試。我也在一直給團(tuán)隊(duì)傳達(dá)這個(gè)理念。我們也會實(shí)時(shí)關(guān)注時(shí)事動態(tài),與熱點(diǎn)做一些結(jié)合。
另一方面,也會與業(yè)務(wù)一起確定需求。每周都會有業(yè)務(wù)來找我們提需求。比如,我們在2012年做的智能剪裁,傳統(tǒng)剪裁縮略圖的方法是直接中間截圖,但實(shí)際的圖片中可能是照片上的人在圖片的一邊而非中央,所以就需要用智能剪裁技術(shù)裁剪更好的縮略圖。當(dāng)時(shí)QQ空間提出了這個(gè)需求,我們覺得很好就做了,而且這個(gè)技術(shù)并不難。但是對于業(yè)務(wù)帶來的好處很大。很多時(shí)候這兩種情況時(shí)并存有交疊的,更多的是我們自發(fā)推動的。
當(dāng)然,還會考慮到布局。我們是一個(gè)一個(gè)項(xiàng)目推進(jìn),這樣就能連成一條線,可以逐步加大加深團(tuán)隊(duì)的積累。比如做了人臉識別之后,我們又做了活體檢測。做對了大方向之后,很多東西就是水到渠成的事情了。