3. 預測分析在醫(yī)學上的應(yīng)用
前列腺癌檢查可早期發(fā)現(xiàn)癌癥,但不是所有的病人都能受益于后繼的治療。因此,辨別出哪些病人最有可能患有侵入性癌癥,將大大減少前列腺活檢試驗。我們收集了1,563例接受了前列腺活檢的病人數(shù)據(jù),采集10微克/毫升或更少的血清PSA數(shù)據(jù),用預測模型對侵入性前列腺癌進行分析。用隨機選取的70%的數(shù)據(jù)對預測模型進行訓練,其余30%的數(shù)據(jù)用于對預測模型進行測試。在1,563例病例中,有406人患有癌癥(26.1%),其中130人患有侵入性前列腺癌(8.3%)。預測模型創(chuàng)建了如下侵入性前列腺癌風險組規(guī)則:
1. PSAD大于0.165ng/ml/cc。
2. PSAD大于0.058 ng/ml/cc且小于0.165 ng/ml/cc , 年齡大于 57.5 歲且前列腺量大于22.7 cc。
預測模型經(jīng)測試數(shù)據(jù)驗證,模型對侵入性前列腺癌的敏感度為91.5% ,特異性為33.5%。在測試數(shù)據(jù)中,當PSAD 是0.058 ng/ml/cc 或更少時,侵入性前列腺癌的發(fā)病率是1.1%。因此,預測模型可以有效地識別侵入性前列腺癌風險組。當單一的高度前列腺癌診斷將導致后繼的治療時,預測模型可以減少33.5%的不必要的活檢試驗。
國外數(shù)據(jù)挖掘在醫(yī)學上的應(yīng)用
數(shù)據(jù)挖掘的很多理論和技術(shù)源自歐美國家,這些國家開展數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用比較早,因此也有長年的數(shù)據(jù)挖掘的技術(shù)積累和經(jīng)驗積累。歐美國家對數(shù)據(jù)挖掘技術(shù)研發(fā)的投入比較大,不僅投入大量的資金,而且還配備了陣容強大的研發(fā)團隊。這些國家對數(shù)據(jù)挖掘技術(shù)的應(yīng)用意識比較高,因此他們對數(shù)據(jù)挖掘技術(shù)的研究熱情較高,將最新技術(shù)應(yīng)用于科學和商業(yè)的需求比較迫切,因此有大量的成熟的、應(yīng)用穩(wěn)定可靠的數(shù)據(jù)挖掘?qū)嶋H應(yīng)用案例。由于他們比較早地應(yīng)用前沿智能信息技術(shù)開展健康與醫(yī)學方面的研究,現(xiàn)在無論從數(shù)據(jù)挖掘研究和應(yīng)用的深度和廣度上都走在了世界前列,并且很多科研成果已經(jīng)轉(zhuǎn)化為有形的技術(shù)與產(chǎn)品,直接得到了廣泛的應(yīng)用,并產(chǎn)生了顯著的社會效益與經(jīng)濟效益。例如,數(shù)據(jù)挖掘在在醫(yī)學應(yīng)用于如下幾個方面。