幾年前,成大過去曾有建立「健康資料加值中心」,後來好像沉寂了一陣子,而大約一年前,在高雅慧老師、李中一老師與其他許多人的努力下,重新開幕,更名叫「衛生福利部 衛生福利資料科學中心 成大分中心」(MOHW Health and Welfare Data Science Center atNCKU),地點移到成大成杏校區的醫學院圖書分館內。所謂的「衛生福利資料」,包括了健保資料庫、國民健康訪查、死因登記檔等很多可相互連結的大型資料庫,可說是做健康大數據研究的寶庫。
當我把最近自己寫的,有關健保資料庫的一些部落格文章,傳給林素真老師分享之後,林老師給了我一個很不錯的提議,在此跟大家分享。
林老師建議,我們的分中心,應該要自許成為一個好的「介面」。
分析大數據,SAS code是一個很大的障礙,像我個人就覺得,寫一段好的SAS code,好像就跟叫我寫唐詩一樣,非常困難,坦白講我過去大都是把SAS軟體內建的範例改一改,或跟善心人士借,或是上網找。
第二個障礙,是藥物分析,特別是一些慢性病藥物,例如高血壓藥,同一個藥物可能有幾十種廠牌,在同一個病人上,可能會有增加藥物種類或劑量、改藥、停藥,這種因子暴露是隨時間改變,很不容易分析的。如果你有做過類似的研究,就知道單做診斷碼的分析,跟做藥物的分析,那種難度差別,可能是「開洗腎人工血管」與「開心臟繞道手術」的差距級別。
根據林老師的建議,也許我們分中心可以考慮分享SAS code,讓更多的研究者可以更輕鬆地上手,進行研究。
在此我舉個例子,這篇論文比較在中風病人當中,具有AFDAS或竇性心律者,未來再度發生缺血性腦中風的風險,刊登在Neurology這個頂尖期刊上,該研究是利用中風登錄資料連結保險申報資料庫做成的,但如果我們看Table 1,其實這個研究可以用健保資料庫重新再做一次,裡面的變量,包括中風的疾病嚴重度,我們都可以輕易取得,而比較其中困難的,應屬「有無使用口服抗凝血劑」或「抗血小板藥物」這項。
(Sposato LA, et al. Neurology 2018)
如果有天,像我現在用的Blogger一樣,分析大數據可以有個介面,可以讓臨床醫師或其他醫事人員快速上手,在符合現行對於資料安全的所有法規條件下,進到加值中心以後,可以很容易地利用這些資料做on-site分析,來驗證自己的研究問題,那麼產出更多有臨床意義與價值的論文,可能就更可以期待了,而我們的資料分中心也可以被更多更有效地利用。
當然,這樣子的想法說來容易,現階段,在執行面尚屬非常地不成熟,還有很多人力、物力、各種技術上的問題需要克服。
而目前,我看到的另一個很不錯的運作模式,是賴嘉鎮老師指導多位碩班學生時採用的模式:建好某個疾病或藥物使用者的common
data model,一個可以直接拿來分析的檔案,然後各個學生就可以依照自己的題目與需求,自行切入分析,如此便大大地節省了許多在初期摸索試誤的時間,指導起來也更有效率。
感謝林老師給了我們一個不一樣的視角,讓我們一起努力改變!