第二,如何提高樣本的有效使用再次成為核心問題。
發(fā)生在物理世界的訓(xùn)練樣本往往獲取非常困難,以機(jī)器人手臂隨機(jī)抓取物體的實(shí)驗(yàn)為例,Google為了獲得訓(xùn)練樣本,只能以14臺(tái)機(jī)械臂在那里日夜不停地獲得訓(xùn)練數(shù)據(jù)。如何高效率的獲得樣本,或者是高效能的使用樣本,將是極其核心的問題。
第三:機(jī)器人領(lǐng)域涉及強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、主動(dòng)學(xué)習(xí)。
對(duì)于機(jī)器人領(lǐng)域的核心技術(shù)強(qiáng)度學(xué)習(xí),特別是深度強(qiáng)化學(xué)習(xí)(Deep Reinforce Learning),幾乎所有我們拜訪的工程師,包括Vincent一致認(rèn)為技術(shù)實(shí)現(xiàn)的難度非常大。
第四:閉環(huán)控制系統(tǒng)對(duì)于改善性能極為必要。
第五:需要新的數(shù)據(jù)結(jié)構(gòu),用于表示運(yùn)動(dòng)學(xué)鏈接(Kinematic chain)、圖像的卷積、運(yùn)動(dòng)軌跡。在之后的問答環(huán)節(jié),他對(duì)遷移學(xué)習(xí)抱有厚望。
老牌的IBM業(yè)務(wù)多元化、而且絕大部分是面向企業(yè)服務(wù)市場(chǎng)(to B)。因此,Michael Witpock提出對(duì)于人工智能領(lǐng)域的研究路線更為系統(tǒng)、同時(shí)也更為傳統(tǒng)。
他提到對(duì)世界的大規(guī)模建模,由之前明確的、符號(hào)化的、分解的建模方式,逐漸融合隱形的、統(tǒng)計(jì)的建模方式。例如之前機(jī)器人動(dòng)力學(xué)方程中對(duì)于摩擦力這類非線性變量的建模和求解時(shí),難度就不校
IBM強(qiáng)調(diào)了符號(hào)主義的重要性,認(rèn)為知識(shí)表達(dá)、邏輯在解決復(fù)雜問題中非常重要。
基于邏輯的傳統(tǒng)知識(shí)表示值得引起我們的重新思考(Rethink)。
IBM在此方面的研究?jī)?yōu)勢(shì)是既有硬件,又有軟件。在整個(gè)IBM的研究人員Michael Witpock演講中,他很自豪地介紹IBM過去在人工智能領(lǐng)域取得的進(jìn)展,并且已經(jīng)廣泛部署到多個(gè)領(lǐng)域,其中有一項(xiàng)是在人力資源領(lǐng)域的應(yīng)用。
對(duì)比一個(gè)國(guó)內(nèi)的案例,某乳品巨頭的人力資源負(fù)責(zé)人在談到人工智能在人力資源領(lǐng)域的應(yīng)用時(shí)不屑一顧地談到人力資源的工作富有人情味,冷冰冰的機(jī)器如何應(yīng)對(duì)。其實(shí),LinkedIn的職位招聘不也是人力資源的一部分嗎?傳統(tǒng)行業(yè)如何面對(duì)高科技的進(jìn)步,被顛覆還是主動(dòng)整合,看似簡(jiǎn)單的答案要落到實(shí)地并不容易。
值得重視的是,隨著人工智能應(yīng)用入侵傳統(tǒng)行業(yè),通常需要對(duì)控制對(duì)象所處的物理環(huán)境建模,這一塊是比互聯(lián)網(wǎng)更廣闊的天地,機(jī)會(huì)更多,當(dāng)然也更難。
發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用
從實(shí)現(xiàn)難度而言,發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用最容易發(fā)生,實(shí)際上推薦系統(tǒng)就是一個(gè)很好的例子,一方面大家對(duì)推薦商品的準(zhǔn)確性相對(duì)寬容。
發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用擠滿各種互聯(lián)網(wǎng)公司巨頭,創(chuàng)業(yè)公司在這個(gè)領(lǐng)域想有所作為也很難,或許還有垂直領(lǐng)域有些機(jī)會(huì)。而創(chuàng)業(yè)公司如何突破人才、數(shù)據(jù)、計(jì)算資源的局限,尋找生存空間值得進(jìn)一步探討。
代表Quora出場(chǎng)的Xavier Amatriain恰好就回答了這個(gè)問題。Quora是家是中小型的創(chuàng)業(yè)公司,是美國(guó)的問答網(wǎng)站(類似于國(guó)內(nèi)的知乎)。Quora只有85位技術(shù)工程師,其中僅僅兩位研究員。人才寥寥、計(jì)算存儲(chǔ)資源不多、數(shù)據(jù)也不是那么充足,
創(chuàng)業(yè)公司怎么能夠避免一些技術(shù)彎路,正確應(yīng)用人工智能技術(shù)呢?Xavier總結(jié)了他這么多年在機(jī)器學(xué)習(xí)實(shí)際工作的一些教訓(xùn)。
1、更多的數(shù)據(jù)還是更好的算法?
Xavier認(rèn)為更好的算法更為重要;
對(duì)于小公司而言,本身數(shù)據(jù)量就少,而獲得標(biāo)記的數(shù)據(jù)更是需要額外的成本。小公司堆數(shù)據(jù)肯定是堆不過大公司,所以選擇把精力放在優(yōu)化算法上往往比選擇把精力放在獲取數(shù)據(jù)上更高效,當(dāng)然一方面小公司也需要不斷地積累數(shù)據(jù)。
2、復(fù)雜模型還是簡(jiǎn)單模型?
Xavier認(rèn)為模型和特征選取需要匹配;
模型不是越復(fù)雜越好,在創(chuàng)業(yè)公司往往是不管黑貓白貓,能抓到老鼠就是好貓。根據(jù)界定的問題,選取與特征相匹配的模型。
3、什么情景下用監(jiān)督學(xué)習(xí)還是非監(jiān)督學(xué)習(xí)?
Xavier認(rèn)為非監(jiān)督學(xué)習(xí)可以降低維度、并對(duì)特征做工程突破。在某些情況下,將監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)結(jié)合,效果出奇的好;