本篇將再多講一講數(shù)據(jù)挖掘在醫(yī)學(xué)上的應(yīng)用,希望能對感興趣的朋友有所啟發(fā),也供從事其他行業(yè)數(shù)據(jù)挖掘應(yīng)用的同仁參考。
數(shù)據(jù)挖掘,又稱知識發(fā)現(xiàn)(KDD),是從大量的數(shù)據(jù)中抽取潛在的、有價值的知識的過程。數(shù)據(jù)挖掘所探尋的模式是一種客觀存在的、但隱藏在數(shù)據(jù)中未被發(fā)現(xiàn)的知識。例如,數(shù)據(jù)挖掘可直接挖掘疾病高發(fā)人群,發(fā)現(xiàn)疾病及癥狀間的未知聯(lián)系,探索化驗指標間的影響關(guān)系及化驗指標與疾病間的潛在影響,對未知的實驗室指標值進行預(yù)測,可以探索合并癥之間的關(guān)系,還可以自動發(fā)現(xiàn)一組高維實驗室指標變量的異常等等。再如,在科研設(shè)計中利用聚類分析,我們可以對數(shù)據(jù)進行科學(xué)分組,通過考察多因素的不同影響權(quán)重,可以幫助確定析因分析或嵌套分析等不同的科研設(shè)計等等。數(shù)據(jù)挖掘在醫(yī)學(xué)中應(yīng)用非常廣泛,它必然為醫(yī)學(xué)臨床和科學(xué)研究提供傳統(tǒng)方法不能企及的又一種前沿技術(shù)手段。
國外數(shù)據(jù)挖掘在醫(yī)學(xué)應(yīng)用上的案例
數(shù)據(jù)挖掘在國外各行各業(yè)得到廣泛的應(yīng)用,醫(yī)學(xué)領(lǐng)域也不例外,很多數(shù)據(jù)挖掘技術(shù)被成功應(yīng)用到醫(yī)學(xué)臨床和科研方面,下面就列舉幾個簡單的案例。
1. 聚類分析在醫(yī)學(xué)上的應(yīng)用
糖尿病是世界上一種常見的疾病,超過18萬美國人患有糖尿病,另有16萬人糖尿病處于糖尿病前期。糖尿病的臨床診斷往往是從身體癥狀和化驗值異常著手的。有些異常指標包括身體質(zhì)量指數(shù)( BMI ),血壓( BP )指數(shù)等。利用聚類分析工具可以分析患者的疾病診斷數(shù)據(jù),以進行探索性的數(shù)據(jù)分析,并考察產(chǎn)生的聚類結(jié)果的意義。至于糖尿病患者的數(shù)據(jù),聚類分析工具試圖按照年齡、種族、性別、體重指數(shù)和BP指數(shù)等產(chǎn)生聚類模式,并將數(shù)據(jù)劃分到相應(yīng)的自然組群中。