來源:百家號
醫(yī)學大數(shù)據(jù)的應用主要有兩個,一個是發(fā)現(xiàn)新知識、認識新規(guī)律。以往受數(shù)據(jù)采集與分析能力的限制,醫(yī)學主要依靠抽樣研究來發(fā)現(xiàn)新知識、認識新規(guī)律,但不同樣本間的差距經(jīng)常導致結論不致甚至截然相反。隨著大數(shù)據(jù)技術的發(fā)展,醫(yī)學研究由抽樣的小樣本研究進入到超大樣本、甚至全樣本研究時代,從嚴格篩選患者入組進行研究到全面觀察各種影響因素的真實世界研究時代。例如,美國2015年就啟動了觀察阿司匹林效果與劑量的大規(guī)模觀察性醫(yī)學研究,多達30萬人參加。
基于大數(shù)據(jù)的觀察性研究得出的結論更具現(xiàn)實指導意義,甚至會推翻之前一些建立在小樣本數(shù)據(jù)基礎上的“科學”結論。斯坦伯格(Steinberg)等人從3萬余人兩年的保險記錄、化驗記錄、用藥記錄、就醫(yī)記錄中挖掘出新的代謝綜合征預測模型,用80%的人作為訓練集,20%的人作為測試集,在貝葉斯框架下依據(jù)**熵原理,對數(shù)據(jù)中未知的參數(shù)進行分布邊緣化來計算模型的結構概率,綜合考慮模型的復雜性和與數(shù)據(jù)的匹配性建立起新的預測模型,從4000余個參數(shù)中篩選出腰圍、用藥依從性等與代謝綜合征密切相關的因素的。
醫(yī)學大數(shù)據(jù)的另一個應用是促進精準適度醫(yī)療,提升醫(yī)療價值。精準醫(yī)療,并不是狹隘地特指基于基因組學的醫(yī)療模式。人體是個復雜的系統(tǒng),疾病是在生活方式、心理、社會-環(huán)境等因素綜合作用下的結果,基因在疾病發(fā)生發(fā)展中只起部分作用。
需要長期采集個體與群體的健康數(shù)據(jù),綜合分析,才能把握各種影響因素與健康的關系。在把握群體規(guī)律的同時,還要把握個體的規(guī)律,才能實現(xiàn)精準的預防與治療。以基因檢測預測疾病為例,被稱為“乳腺癌1號基因”的BRCA1,突變后使人罹患乳腺癌的風險是65%(以70歲計;置信區(qū)間44%~78%),而不是100%,沒有這個基因突變的人患乳腺癌的概率也不為0。
評估未來患病的概率是預測的價值,但是預測與診斷是截然不同的,預測具有不確定性,診斷則要求確定性。一個有BRCA1基因突變的人是否都應該像影星朱莉一樣預防性地將乳腺切除?如何確定一個有BRCA基因突變的人是屬于會發(fā)病的一撥,還是不發(fā)病的另一撥呢?再以高血壓為例,判斷所有成年人高血壓的界值都是統(tǒng)一的14090mmHg,而實際上數(shù)據(jù)分析顯示,血壓高于140/90mmHg的人中有很大比例患心血管風險并不高,而血壓低于12080mmHg的人中有些人患心血管疾病風險也并不低。
研究顯示,同樣是收縮壓為150mmHg的青年人,其患心血管風險的差別卻非常大。無論是基因突變還是高血壓,危險因素與疾病之間的關系是復雜的,不能簡單化、絕對化地理解,需要針對不同的個體具體分析。由個體差異性帶來的不確定性是醫(yī)學復雜性的重要體現(xiàn)。隨著醫(yī)學的進步,源于個體的數(shù)據(jù)越來越豐富,包括組學數(shù)據(jù)、健康監(jiān)護數(shù)據(jù)、影像數(shù)據(jù)等。計算機科學與醫(yī)學結合能夠挖掘出新的知識,開創(chuàng)新的診療模式。例如心理問題一般是通過臨床觀察或自我就醫(yī)的方式被發(fā)現(xiàn)并診斷的,現(xiàn)實中缺乏客觀有效的診斷方法,而基于說話(復述一件事情)模式的數(shù)據(jù)挖掘,能夠發(fā)現(xiàn)患者條理表達能力的下降,進而成功預警心理問題,在小樣本人群實驗中達到了100%的準確度。通過機器學習對一些復雜信息進行處理,也能對心臟病、哮喘、癌癥等疾病作診斷和預測,能夠達到或超越專家的診斷水平。
|