使用聚類分析工具探索性地分析糖尿病患者的基本指標(biāo)數(shù)據(jù),通過良好的劃分類均值來產(chǎn)生聚類。本案例中,對于已有的3個不同的數(shù)據(jù)集進(jìn)行聚類分析,產(chǎn)生的聚類數(shù)在5到8之間,每個聚類中的病人數(shù)量有多有少,運(yùn)算聚類所消耗的時間大約在5秒鐘到4分鐘之間。
通過聚類分析,專家們在所有3個數(shù)據(jù)集中共得到4種類型的患者:
·患者為肥胖(體重指數(shù)> 56 ),但血壓正常;
·患者基本指標(biāo)(BMI,BP)是正常的 ;
·患者血壓在正常范圍內(nèi),但體重指標(biāo)異常 ;
·患者基本指數(shù)(BMI,BP)異常 ;
以上4種糖尿病的聚類結(jié)果揭示了糖尿病患者典型的四個分型,在臨床上具有重要意義。
2. 關(guān)聯(lián)規(guī)則分析在醫(yī)學(xué)上的應(yīng)用
關(guān)聯(lián)規(guī)則是一個發(fā)現(xiàn)醫(yī)療數(shù)據(jù)中隱藏關(guān)聯(lián)模型的有前途的技術(shù)。通常,關(guān)聯(lián)規(guī)則在醫(yī)療數(shù)據(jù)中挖掘出大量的規(guī)則,規(guī)則數(shù)量不僅相當(dāng)大,而且其中大部分規(guī)則在醫(yī)學(xué)上是無關(guān)緊要的。對于有用的一些規(guī)則,醫(yī)學(xué)專家尋找的速度很慢,而且發(fā)現(xiàn)了規(guī)則以后解釋起來也很困難。在這項工作中,我們引入搜索約束,以只發(fā)現(xiàn)在醫(yī)學(xué)上有意義的關(guān)聯(lián)規(guī)則,并使規(guī)則搜索更有效。
例如,應(yīng)用關(guān)聯(lián)規(guī)則分析發(fā)現(xiàn)心臟灌注測量和病人危險因素與四個特殊的動脈狹窄程度緊密相關(guān)。我們通常用關(guān)聯(lián)規(guī)則的支持度、置信度、以及LIFT指標(biāo)來評價其在醫(yī)學(xué)上的意義,如圖一所示。