深度、卷積、遞歸模型對人類行為進行識別(可穿戴設(shè)備數(shù)據(jù))
摘要
普適計算領(lǐng)域中人類活動識別已經(jīng)開始使用深度學(xué)習(xí)來取代以前的依靠手工提取分類的分析技術(shù)。但是由于這些深度技術(shù)都是基于不同的應(yīng)用層面,從識別手勢到區(qū)分跑步、爬樓梯等一系列活動,所以很難對這些問題提出一個普遍適用的方案。在本文中我們認真地探索了深度、卷積、遞歸方式對三種代表性的包含運用可穿戴感應(yīng)器測得的運動數(shù)據(jù)組進行的實驗。我們將展示怎樣訓(xùn)練遞歸方法并介紹一種創(chuàng)新性的規(guī)范方式,講述它們?nèi)绾卧诖笮突A(chǔ)數(shù)據(jù)集上實現(xiàn)現(xiàn)有技術(shù)下最好的表現(xiàn)。通過使用隨機樣本模型進行數(shù)千次實驗,我們對每個人類活動識別中的不同任務(wù)中的模型適用性進行了探究,對使用fANOVA架構(gòu)的超參數(shù)影響做了探索,為以后想將深度學(xué)習(xí)應(yīng)用到他們的研究中的學(xué)者提供了參考。
1. 引言
過去幾年里深度學(xué)習(xí)已經(jīng)成為機器學(xué)習(xí)領(lǐng)域中最流行的研究方向。由于這個概念的流行導(dǎo)致它的分支已經(jīng)快速擴張,且在學(xué)術(shù)界和商業(yè)界的推動下勢必還會進一步推進。對于普通人來說,深度學(xué)習(xí)中像Torch7這一類機器學(xué)習(xí)框架已經(jīng)隨手可及,深度學(xué)習(xí)對一系列的運用層面也有相當大的影響。
另外一個因為深度學(xué)習(xí)受益的領(lǐng)域是在普適計算方面的人類活動識別(HAR)。在HAR領(lǐng)域中占主導(dǎo)地位的技術(shù)方法包括用身體佩帶的傳感器,手動設(shè)計特征提取程序,以及各種(監(jiān)督)分類方法。在許多情況下這些相對簡單的裝置就足夠了,能夠得到令人印象深刻的識別精度。然而對于更復(fù)雜的行為,例如在醫(yī)學(xué)應(yīng)用中,這種手動調(diào)教方法還是存在顯著挑戰(zhàn)。有些工作還進一步進行,這也許可以解釋一些明顯的慣性在通過深度學(xué)習(xí)技術(shù)領(lǐng)域的主要技術(shù)途徑。
深度學(xué)習(xí)在普適計算方面的人類識別活動上有機會造成很大影響。它可以替代缺乏有利于其他領(lǐng)域如語音識別強大的魯棒性,設(shè)計了手動特征提取程序。然而,對于從業(yè)者來說困難的是選擇為他們的應(yīng)用最合適的深度學(xué)習(xí)方法。促進深度學(xué)習(xí)幾乎都提供了最佳的系統(tǒng),很少有工作包括在其最優(yōu)參數(shù)是如何被發(fā)現(xiàn)等細節(jié)。由于只有一個分數(shù)報告,平均性能與峰值性能比較結(jié)果仍不清楚。
在本文中,我們運用目前最先進的深度學(xué)習(xí)方法對普適計算中的人類行為識別中的三種問題進行了探索。針對深度、卷積和遞歸模型的訓(xùn)練過程進行了詳細描述,并且我們針對遞歸性網(wǎng)絡(luò)介紹一種創(chuàng)新規(guī)劃方法。在4000多個實驗中,我們探討HAR中每個超參數(shù)對不同的影響,為以后想將深度學(xué)習(xí)應(yīng)用到他們的研究中的學(xué)者提供了參考。在這些實驗的過程中我們發(fā)現(xiàn),遞歸性網(wǎng)絡(luò)實現(xiàn)了目前最佳的表現(xiàn)。

圖1 本文中使用的模型
2. 普適計算中的深度學(xué)習(xí)
通過穿戴設(shè)備感應(yīng)器獲得的運動數(shù)據(jù)是多元時間序列數(shù)據(jù),這些數(shù)據(jù)都有相關(guān)的高維時空頻率(20Hz-200Hz)。在普適計算領(lǐng)域中分析這些數(shù)據(jù)基本上是在Bulling等人所提出的基礎(chǔ)方法上進行的。第一步是把時間序列數(shù)據(jù)分割成相鄰的片段,通常是通過單個特點或者是滑動窗分割技術(shù)。在分割出一系列特性中,在每一幀最有可能包含的是統(tǒng)計特性或者頻率域中的詞干。
目前在普適計算領(lǐng)域中最流行的方法是卷積網(wǎng)絡(luò),許多作者都用它來處理活動識別任務(wù)。更進一步的是,卷積網(wǎng)絡(luò)已經(jīng)被用來處理特定領(lǐng)域的問題,像在Autism中檢測常規(guī)運動等,它們以及能將其提升到目前最佳的水準。
3. 針對人類活動識別對深度學(xué)習(xí)進行比較
雖然在不同情境的人類行為識別(HAR)方面已經(jīng)有過一系列的研究探索,但是對于深度學(xué)習(xí)的兼容性上仍然缺乏一個系統(tǒng)性的研究。研究者進行初步試驗對邊界空間進行探索,但通常忽略了細節(jié)問題,這使得整個過程仍然不明確且難以重復(fù)。相應(yīng)的,像CNNs這樣的單一網(wǎng)絡(luò)在單一應(yīng)用情境下表現(xiàn)良好。然而,單個的良好表現(xiàn)并不能代表整體在普適計算在人類行為識別上的普遍適用性。在限定條件下的探索實驗中,這些結(jié)果有多少代表性?哪些參數(shù)對于最終表現(xiàn)影響最大?實驗者怎么找到那個剛好適合他們研究的參數(shù)?這些問題對于研究學(xué)者們十分重要,但是目前這些問題仍然沒有解答。