Slack、Facebook Messenger、Alexa 和虛擬現(xiàn)實(shí)商店等新平臺(tái)的增長(zhǎng)對(duì)開(kāi)發(fā)者來(lái)說(shuō)也是有利的,因?yàn)槠脚_(tái)會(huì)越來(lái)越開(kāi)放、會(huì)增加讓開(kāi)發(fā)者生活更簡(jiǎn)單的應(yīng)用、還會(huì)通過(guò)投資基金等手段互相競(jìng)爭(zhēng)以獲得開(kāi)發(fā)者的關(guān)注。
最終,在接口層上,我們將看到文本、語(yǔ)音和視覺(jué)的“自然接口”將解鎖會(huì)話商務(wù)和增強(qiáng)現(xiàn)實(shí)/虛擬現(xiàn)實(shí)等新型類別的接口。我們對(duì)這些接口的未來(lái)是非常樂(lè)觀的,因?yàn)樗鼈兪侨祟惢ハ嘀g、人類與世界之間互動(dòng)的方式。
構(gòu)建模塊和學(xué)習(xí)服務(wù)
智能構(gòu)建模塊和學(xué)習(xí)服務(wù)將會(huì)成為應(yīng)用背后的大腦。

圖片來(lái)源: TechCrunch 。
隨著企業(yè)們對(duì)微服務(wù)開(kāi)發(fā)模式的采用,即插即用不同機(jī)器學(xué)習(xí)模型和服務(wù)以實(shí)現(xiàn)特定功能的能力將變得越來(lái)越有價(jià)值。在這一層面上,我們能看到兩種類型的企業(yè):一類是原始機(jī)器智能提供商,另一類是訓(xùn)練模型(即“模型即服務(wù)”)提供商。
第一類提供商為智能應(yīng)用開(kāi)發(fā)者提供“原始的”或核心構(gòu)建模塊,如算法和部署過(guò)程。第二類提供商則為企業(yè)提供中間服務(wù),讓企業(yè)可以即插即用地使用預(yù)訓(xùn)練模型處理圖像標(biāo)記、自然語(yǔ)言處理或產(chǎn)品推薦等任務(wù)。這兩類智能應(yīng)用背后的企業(yè)為智能應(yīng)用提供了很大一部分價(jià)值,但這一層的關(guān)鍵問(wèn)題是如何確保這些構(gòu)建模塊能獲取它們提供給終端用戶的一部分價(jià)值。
IBM 沃森的方法是免費(fèi)為開(kāi)發(fā)者提供其 API 的使用權(quán),但在開(kāi)發(fā)者的應(yīng)用被發(fā)布給消費(fèi)者時(shí)會(huì)收取其 30% 的收入。其它一些提供商則基于 API 調(diào)用、計(jì)算時(shí)間或虛擬機(jī)進(jìn)行收費(fèi)。
這一層的企業(yè)的關(guān)鍵不同在于:為開(kāi)發(fā)者提供優(yōu)質(zhì)用戶體驗(yàn)的能力,以及機(jī)器學(xué)習(xí)算法和模型的準(zhǔn)確度和性能。
對(duì)于自然語(yǔ)言理解等復(fù)雜而又通用的問(wèn)題,如果供應(yīng)商具有最好的數(shù)據(jù)、模型和流程,預(yù)構(gòu)建的模型很可能會(huì)更簡(jiǎn)單、性能更高。但是,對(duì)于特殊的特定業(yè)務(wù),創(chuàng)業(yè)公司和企業(yè)得開(kāi)發(fā)他們自己的模型和數(shù)據(jù)集。
數(shù)據(jù)收集和準(zhǔn)備
困難又枯燥的數(shù)據(jù)收集和準(zhǔn)備任務(wù)將變得更智能。
在數(shù)據(jù)被準(zhǔn)備好送入機(jī)器智能的工作流程或模型之前,還需要進(jìn)行收集、聚集、清理和準(zhǔn)備。消費(fèi)者和企業(yè)應(yīng)用的數(shù)據(jù)來(lái)源包括照片和視頻、網(wǎng)站和文本、客戶行為數(shù)據(jù)、IT 運(yùn)營(yíng)數(shù)據(jù)、物聯(lián)網(wǎng)傳感器數(shù)據(jù)和網(wǎng)頁(yè)數(shù)據(jù)。
當(dāng)應(yīng)用儀器收集到原始的數(shù)據(jù)之后,還需要將其轉(zhuǎn)換成機(jī)器支持的格式。比如,企業(yè)需要將文本文件和照片等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成機(jī)器可以審查的結(jié)構(gòu)化數(shù)據(jù)。這一步中,必須認(rèn)識(shí)到模型的質(zhì)量高度依賴于其輸入數(shù)據(jù)的質(zhì)量。沒(méi)有高質(zhì)量訓(xùn)練數(shù)據(jù)而開(kāi)發(fā)的 bot 或“人工智能”可能會(huì)導(dǎo)致意想不到的后果(參考微軟的 Tay),而這種訓(xùn)練數(shù)據(jù)的收集往往依賴于半手動(dòng)的過(guò)程,比如眾包或查找歷史數(shù)據(jù)集。
這一領(lǐng)域中其它值得關(guān)注的部分是傳統(tǒng)上作為數(shù)據(jù)源(如點(diǎn)擊流數(shù)據(jù)或應(yīng)用性能日志)的“笨”管道的公司。它們不僅將嘗試構(gòu)建預(yù)測(cè)性和適應(yīng)性的功能,還將面臨來(lái)自希望從相同的數(shù)據(jù)源中提取觀點(diǎn)的智能服務(wù)的競(jìng)爭(zhēng)。
這將成為金融、客戶關(guān)系管理、IT 運(yùn)維、市場(chǎng)營(yíng)銷、人力資源等傳統(tǒng)上收集數(shù)據(jù)但不即時(shí)提取觀點(diǎn)的行業(yè)的一個(gè)創(chuàng)新領(lǐng)域。比如,HR 軟件將基于之前招聘的歷史數(shù)據(jù),在提供面試反饋和關(guān)鍵崗位最佳候選者方面,表現(xiàn)得越來(lái)越好。
數(shù)據(jù)基礎(chǔ)設(shè)施
智能應(yīng)用將構(gòu)建于大數(shù)據(jù)技術(shù)的基礎(chǔ)上。

圖片來(lái)源: Flickr/Marius B under a CC by 2.0 license
全世界的數(shù)據(jù)量每 18 個(gè)月翻一番,而且因?yàn)檫@種大數(shù)據(jù)爆炸,企業(yè)已經(jīng)在存儲(chǔ)和數(shù)據(jù)分析上投入了巨資。
Hadoop 和 Spark 這樣的項(xiàng)目已經(jīng)成為了較大型的應(yīng)用智能生態(tài)系統(tǒng)的關(guān)鍵推動(dòng)者,而且它們也將繼續(xù)在智能應(yīng)用各個(gè)層次中充當(dāng)關(guān)鍵角色。在選擇分析基礎(chǔ)設(shè)施上,開(kāi)源仍將是一個(gè)重要的特性,因?yàn)榭蛻粝M吹?ldquo;引擎蓋下”是什么,以及避免在他們選擇數(shù)據(jù)的存儲(chǔ)位置和方式時(shí)被供應(yīng)商限制。
在 IaaS(基礎(chǔ)設(shè)施即服務(wù))領(lǐng)域內(nèi),每一家主要的云提供商都將爭(zhēng)取支持智能應(yīng)用的工作負(fù)載。我們已經(jīng)看到一些公司開(kāi)源了自己 IP(知識(shí)產(chǎn)權(quán))的關(guān)鍵領(lǐng)域(如谷歌的 TensorFlow 機(jī)器學(xué)習(xí)平臺(tái)),從而將企業(yè)和開(kāi)發(fā)者吸引到它們的平臺(tái)。尤其是谷歌,未來(lái)將成為一家值得關(guān)注的公司,因?yàn)楣緸樵鲩L(zhǎng)核心 IaaS 業(yè)務(wù),而將自己通過(guò)世界上最大的數(shù)據(jù)集訓(xùn)練的機(jī)器學(xué)習(xí)模型開(kāi)放給用戶。