蘋果首先發(fā)布了其中四個圖像識別模型以及一個面向計算機視覺和自然語言處理的API。這些工具在用戶設備本地運行,也就是說,數(shù)據(jù)仍然是私有的,永遠不需要在云上進行處理。
此外,蘋果還讓AI開發(fā)人員可以很容易地將他們自己喜歡的AI引入蘋果設備。某些種類的深度神經網絡可以直接轉換為Core ML。
蘋果現(xiàn)在提供了Caffe和Keras支持,前者是由加州大學伯克利分校開發(fā)的一款用于構建和訓練神經網絡的開源軟件,后者是一個可以簡化那個過程的工具。值得注意的是,它不支持谷歌的開源AI框架TensorFlow。不過,創(chuàng)建者可以構建自己的轉換器。
在蘋果提供的預訓練模型中,有一部分是開源的谷歌代碼,主要面向圖像識別。
需要說明的是:蘋果并不是第一個發(fā)布可在移動設備運行的深度學習工具的公司。
在WWDC之前的谷歌I/O大會上,谷歌發(fā)布了“為移動而生”的TensorFlow Lite,它將允許開發(fā)人員在用戶的移動設備上實時地運行人工智能應用,有多款在移動設備上使用 TensorFlow 做翻譯、風格化等工作;TensorFlow 在移動設備 CPU(高通 820)上,能夠達到更高的性能和更低的功耗。
而早在 2016 年 11 月,F(xiàn)acebook 就已經發(fā)布了一個稱為 Caffe2Go 的架構。Caffe2Go 用于實時風格轉移(Style Transfer),即在用戶的移動設備添加了類藝術(Art-like)過濾器。在今年的 F8 大會上, Facebook 進一步發(fā)布了 Caffe2,正式支持移動平臺。而除此之外,MxNet 深度學習框架也支持多個平臺,包括移動設備。
和Tensorflow、Caffe等深度學習框架不同,Core ML是完全聚集于在設備端本地進行深度學習推理的框架,而其它框架除了支持本地設備端同時也支持云端,能夠推理也支持訓練。蘋果宣傳Inception v3速度是Tensorflow的6倍,這是通過MetalAPI對于GPU能力充分利用的結果。
相較于其他移動端深度學習框架,Core ML看起來更方便使用。蘋果很聰明的定義了一個標準的模型格式(.mlmodel),提供了流行的框架模型到該格式的轉換工具,比如你可以將你的Caffe模型轉換成Core ML的模型格式。這樣就可以利用各個模型的訓練階段,而不像TensorflowLite只能使用Tensorflow模型。模型訓練好了之后,只要拖放到XCode中就可以使用,蘋果甚至把接口的Swift代碼都生成好了,非常方便。
從目前的情況看來,Core ML似乎在移動端上的表現(xiàn)更勝一籌,但是將來是否真的可以保持穩(wěn)定發(fā)揮,還得靠時間來檢驗。
蘋果系統(tǒng)中AI應用
蘋果在之前的開發(fā)者大會上的主題演講中清楚地向大家表明,發(fā)生在手機上的每個動作都會被記錄,然后由操作系統(tǒng)的一系列機器學習算法進行分析,判斷是否預示著用戶希望要做一個日歷預約、撥打一個電話,或者制作更好的動態(tài)照片。像Apple music的聽歌推薦,通過對用戶聽歌記錄的學習來調整作出相應的推薦;iphone的電池續(xù)航,手機的電池管理系統(tǒng)使用了機器學習,了解了用戶的使用習慣并作出相應的調整,使續(xù)航更持久。
另外從Siri的聲音也可以看出蘋果用到了機器學習。他們不再使用預先錄制好的標準答案,現(xiàn)在,Siri的聲音完全是由AI生成的。這樣更靈活(蘋果在大會上示范了四種不同的音調),隨著技術的發(fā)展,它聽上去會越來越像真人(蘋果的競爭對手離這個目標已經不遠了)。
學術研究
蘋果只發(fā)表了一篇論文,并且獲得了CVPR 2017最佳論文。蘋果AI研究負責人Ruslan Salakhutdinov一直在做巡回演講(很大程度上是為了招聘到AI頂尖人才)。舉例來說,他在Nvidia的GPU技術大會上了發(fā)表了演講,之后他還會在紐約發(fā)表演講。此外,去年年底,在Salakhutdinov上任后不久,蘋果在一個重大的AI會議上和他們的競爭對手舉行了一場閉門會議。但是,就目前競爭激烈的AI市場來講,論文和演講的威懾力似乎遠不如實在的研究成果來的強大。蘋果公司如果想成為全球AI領跑者,未來的路似乎并不好走。