Re: [請益] 為何不能用全民腦造影來建立高關懷名單?
最近看到有篇研究報告內容跟這個標題有一些關聯,轉貼與大家分享
http://pansci.asia/archives/101157
fMRI 分析軟體發現瑕疵,近15年的腦科學研究可能有問題
近幾年不論歐美或台灣都提出了腦科學專案研究計畫,期許透過非侵
入性的功能性磁振造影(fMRI),來瞭解人的心理與背後的神經機制
。此種能將抽象心理化作實體大腦活動影像的技術,讓我們對身心關
係有了更進一步的理解。
然而近期一篇發表在《美國國家科學院刊》(PNAS)的研究結果,卻
令人震驚!研究者發現處理 fMRI 數據的分析軟體上有瑕疵,可能讓
過去 15 年、累積近四萬筆的腦科學研究結果被打上了問號。這對腦
科學界來說可是件大事,因為 fMRI 是目前相關研究常使用的工具,
若分析軟體真有缺陷,就表示過往的許多腦科學研究結論,如談戀愛
時的腦、上癮的腦……都必須被重新檢視了!
fMRI 對腦科學家來說有多重要?
研究計畫主持人、來自瑞典林雪坪大學(Linköping University)
的安德斯.埃克隆德(Anders Eklund)博士表示:「雖然腦科學界
常以 fMRI 來研究腦功能,但它的分析方法鮮少經過真實數據所驗證
。」
要了解埃克隆德為什麼這樣說,以及 fMRI 技術的問題,我們得先了
解 fMRI 怎麼運作。
fMRI 就如同一塊大磁鐵般,透過變化磁場以非侵入性的方式,來測
定大腦內不同區位的血流氧氣變化。在實驗的過程中參與者會躺進機
器內,被指派做一些任務(例如記憶、看表情圖片等……),而理論
上這時各腦區的活化程度會有所不同,因此當磁場改變掃過你的身體
時,便能夠偵測出那些微的血流變化。
這些細微的血氧變化,對於科學家來說就如同指標,它們訴說著某一
腦區正在運作,好比在執行賭博任務時腦島(insular)就被觀察到
有差異——這一腦區被認為是與高階的認知功能相關,例如語言處理
、同理心(empathy)、惻隱之心(compassion)。
腦科學研究結果看起來新奇厲害,但科學家看到的花花綠綠腦影像圖
,其實都不是腦袋真實的樣子,精準一點地說,他們看到的是把完整
腦袋分割成上萬個體素(或稱立體像素,voxel)的圖片,並用這些
圖片來做進一步的分析與推論。(voxel 是 3D 腦造影圖的解析單元
,有點類似 2D 照片的像素概念。)
在許多報導中看到的精彩研究結果,好比說「科學家發現了與性慾有
關的腦區伏隔核(NAcc)」,其實不盡然是大腦在任務中真實的反應
樣貌,多是化成 voxel 且經軟體分析後的結果。
分析軟體哪裡出問題了?
為此埃克隆德及其團隊想探討的,就是這套分析軟體的可信度有多高
。他們從腦科學研究計畫(1000 Functional Connectomes Project
)所建立的資料庫中,取得了 499 位健康志願者在靜息狀態(
resting-state)下的腦影像圖,將這些資料分成 20 組並隨機配對
出近 3 百萬筆的比較資料。
他們用這些資料測試了三款在 fMRI 資料分析中最常用的套件軟體—
—SPM、FSL 和 AFNI ,令人驚訝的是,不論是哪種軟體所呈現的分
析結果,假陽性機率(false-positive rate)都高達 70%,也就是
說很容易出現其實某一區域沒有活化,卻可能被誤判成有所反應的狀
況!
理論上,團隊預期看到的結果假陽性機率只會有 5%(也就是統計上
常用的單尾 p = .05),但百萬筆資料的重複比較下,看到卻是高出
許多的 70%,表示所得到「某腦區有活化」的結果很可能不是那麼精
確,中間顯然出了某些分析流程上的瑕疵。此次的研究結果,無疑是
在對過往的腦科學資料提出質疑。
但腦科學領域並沒有就此打住腳步,分析軟體的工程團隊早已於去年
五月、該研究開始寫報告時,就做了分析軟體的瑕疵修正。一連串的
結果與考驗,再再顯示著 1990 年初才逐漸蓬勃的腦科學領域,還有
著許多操作上的挑戰與分析方法需要改進。
fMRI 仍太貴,研究樣本數難提高
技術上的考驗外,另一項對實驗者的大阻礙是昂貴的儀器使用費,在
美國光使用一小時的 fMRI 就需要支付 600 美元,台灣雖然便宜一
點,但也是每小時動輒三、四千元起跳。這也造就了一個限制,為了
降低成本,多數研究傾向將參與樣本數維持在 30 人左右,僅有少數
得到足夠計畫資金的研究團隊,才有辦法大量收樣本,重複測驗他們
的實驗結果。
不僅如此,fMRI 在硬體層面也面臨考驗。分析軟體的運作效率十分
依賴電腦硬體的好壞,若硬體太舊可能光是驗證資料就要跑了三天三
夜,還不一定完成的了!
事到如今,那些受質疑的研究該怎麼辦才好?
針對這篇研究的結果,有些科學家依然抱持著質疑的態度,認為有過
分誇大了問題的影響。其中包括作者之一的尼可斯(Thomas Nichols
),事後在自己網誌中提出了中立的看法,將原先可能受影響的研究
從四萬下修至 3500 篇,還強調這三千多篇也不全然就是錯,必須考
慮到各實驗的測量效應強弱才行!
So, are we saying 3,500 papers are “wrong”? It depends
…….if the effects are really strong, it likely doesn’t
matter if the P-values are biased, and the scientific
inference will remain unchanged.
看了腦科學領域目前的困難後,還是有值得開心的好消息。此領域的
研究已經進行了十多年,資料也累積了數萬筆,有越來越多團隊將自
家實驗的數據開放在網路上,供其他研究者使用與檢驗,因此省下一
些經費。
每一次的衝擊都是一個挑戰,反過來說卻也是督促這個研究領域成長
的助力。如同去年在心理學界掀起的一陣驚濤駭浪,有研究者試圖重
現一百項經典的心理學實驗,卻僅有三分之一可以被再現。正因這些
研究證據,讓我們重新去正視科學研究中的重製與再現(replicate
)問題。
不過,雖然這篇論文引起許多人去正視這些問題,但現實總是殘酷—
—在學術界中去重製前人已做過的實驗,其實沒有多大的吸引力,去
執行一個自己新發想的實驗通常才令人興奮。但當有越來越多這種檢
驗性的研究被發表後,或許我們就必須要重新考慮並面對「重製檢驗
」的必較性了!
原始論文:
Anders Eklund, Thomas E. Nichols, and Hans Knutsson,
Cluster failure: Why fMRI inferences for spatial extent
have inflated false-positive rates, PNAS 2016 :
1602413113v1-201602413.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.217.181
※ 文章網址: https://www.ptt.cc/bbs/ask-why/M.1468427757.A.683.html
推
07/15 23:03, , 1F
07/15 23:03, 1F
→
07/16 19:19, , 2F
07/16 19:19, 2F
→
07/18 00:51, , 3F
07/18 00:51, 3F
討論串 (同標題文章)
完整討論串 (本文為第 4 之 4 篇):
ask-why 近期熱門文章
PTT職涯區 即時熱門文章