團(tuán)隊(duì)介紹:
我們是來(lái)自人稱“上有天堂,下有蘇杭”的美麗杭州的浙江大學(xué)數(shù)字媒體與設(shè)計(jì)實(shí)驗(yàn)室的dcd608。
在海量數(shù)據(jù)來(lái)臨之時(shí),我們深知云計(jì)算自然而然地登上并將在歷史的舞臺(tái)大放異彩。與此同時(shí),致力機(jī)器學(xué)習(xí)與多媒體理解的我們這個(gè)團(tuán)隊(duì)希望讓機(jī)器學(xué)習(xí)更加切實(shí)可行,從而方便我們的生活,智能我們的生活。
成員:高海東、盧鑫炎、譚谞
作品介紹:
題目:你不知道我知道
設(shè)計(jì)思想
1 分析問(wèn)題信息,選擇合理的評(píng)分方式,對(duì)待選問(wèn)題進(jìn)行篩選。
2 用戶可能關(guān)心的是同一類問(wèn)題。
3 用戶可能對(duì)某一些關(guān)鍵詞相關(guān)的問(wèn)題感興趣。
4 用戶可能對(duì)某一些提問(wèn)者的問(wèn)題感興趣。
5 用戶可能對(duì)同一種導(dǎo)入方式的問(wèn)題感興趣。
設(shè)計(jì)特色
1 運(yùn)用Map-Reduce中分布式緩存(DistributedCache)的思想將問(wèn)題化繁為簡(jiǎn)。
2 對(duì)放數(shù)據(jù)還是參數(shù)入DistributedCache做了合理的選擇,從而合理地利用Hadoop平臺(tái)的資源。
題目:難舍難分
設(shè)計(jì)思想
1 我們采用了“多類邏輯斯蒂回歸”(Multi-class Logistic Regression)的方法去求解,而不像很多算法是把多分類問(wèn)題轉(zhuǎn)換為二分類問(wèn)題。
2 我們采用了梯度下降(Gradient Descent)的方法。
設(shè)計(jì)特色
1 運(yùn)用Map-Reduce中分布式緩存(DistributedCache)的思想將問(wèn)題化繁為簡(jiǎn)。
2 對(duì)放數(shù)據(jù)還是參數(shù)入DistributedCache做了合理的選擇,從而合理地利用Hadoop平臺(tái)的資源。
3 將數(shù)據(jù)分塊處理,進(jìn)一步降低了map和reduce之間的傳輸消耗,提高了時(shí)間。
4 使用二進(jìn)制格式傳輸主要數(shù)據(jù),很大程度上提高了效率。
難舍難分