【好文觀點分享】運動無益身體健康?
運動與身體健康
原文作者:Kathryn Birkenbach, Peter Attia
節錄翻譯與編輯:蔡奇儒
在健康與長壽的領域中,存在一些幾乎不會有爭議的通則:像是「控制熱量攝取」、「讓身體脂肪量在健康範圍內」、「不吸菸」、「充足睡眠」、「保持身體活動」。
然而,時不時就會有論文出現,聲稱顛覆這些基本原則之一。
去年在 bioRxiv 上分享的一份預印本 (preprint) 便是如此,該篇作者得出結論:體育活動與降低死亡率之間沒有因果關係。然而,儘管此類出乎意料的報告在大眾媒體上非常吸引眼球,但新奇並不保證品質。
你可能會質疑為什麼值得花時間深入研究這樣的研究。事實上,我經常被問到:「如何培養解讀頭條的能力?」答案在於過程。你需要反覆練習,就像健身訓練需要時間反覆練習與讓身體產生適應一樣。
該篇研究作者 Kankaanpää 等人旨在確定休閒時間體育活動(Leisure-Time Physical Activity, LTPA)與全因死亡率之間的關係。
該研究包含來自芬蘭雙胞胎世代中的同性別雙胞胎,這些雙胞胎在1958年之前出生,並於1975年時年齡介於18–50歲。
LTPA 透過問卷調查於1975年、1981年和1990年三次評估,並分類為久坐、適度活動、活動和高度活動(這些分類的基礎尚不明確,但根據圖表,這些分類以每小時代謝當量(METs)來表示)。死亡率的監測從1990年到2020年,使用芬蘭人口登記中心和統計數據進行分析。在排除1990年之前死亡或未返回至少一份 LTPA 問卷的參與者後,最終分析納入了共22,750名參與者。
圖表:不同時間點和活動水平的休閒時間體育活動,表達為每日 MET 小時數。虛線表示世界衛生組織指南推薦的最低活動水平。
Kankaanpää 等人的數據顯示,在1990至2020年的追蹤期間,久坐組的參與者死亡率顯著高於其他三組(38.8% 對 30.8%、29.0% 和 25.4%,分別為適度活動、活動和高度活動組)。相對於久坐組,這意味著適度活動組全因死亡風險減少15%(95% CI:0.80–0.90),活動組減少18%(95% CI:0.77–0.87),高度活動組減少23%(95% CI:0.70–0.84)。
然而,研究人員報告稱,在調整其他健康相關變數(如 BMI、教育水平、吸菸狀況和酒精使用)後,久坐與適度活動或活動組之間的風險差異下降至僅7%(兩者比較的95% CI:0.88–0.99),而高度活動組相較於久坐組則未顯示出統計學上的顯著風險下降。
此外,排除那些報告在死亡追蹤開始之前(即1975或1981年問卷調查時)患有心絞痛、糖尿病或心臟病史的參與者後,三個活動組中無一顯示出顯著低於久坐組的風險。
根據這些數據,作者得出結論,LTPA 與降低死亡風險之間的表面關聯是由其他健康相關變數引起的混雜所致。換句話說,「與其說 LTPA 本身降低了死亡風險,不如說是活動本身可能是健康體質和整體健康生活方式的指標,這兩者都與較低的死亡風險同時發生。」
我們接受這樣的論點嗎?
在優點方面,這項研究具有長期追蹤期。但這幾乎就是其優勢的終點。另一方面,談到弱點,我們正在面對一個看起來比《戰爭與和平》還要冗長的缺陷清單。為節省時間,我們只關注兩個主要的問題:數據收集的重大缺陷和分析與解釋的關鍵缺陷。
不可靠且不足的數據收集
除了死亡數據外,所有用於生成這些發現的數據均來自於1975年、1981年和1990年的自我報告問卷 —而這些問卷在30年的死亡率追蹤開始之前很久就已完成。即使在最好的情況下,自我報告數據也容易受到無數偏差的影響,如不準確的回憶、社會接受度等因素的影響,但考慮到在青年或中年期間報告的運動習慣能否在接下來的30年內保持不變,這種方法無疑是荒謬的。
而且情況更糟 —回想起來,參與者只需返回最少一份問卷即可納入分析,而事實上,近一半的參與者未對1990年的調查做出回應,這意味著該研究假設1981年(甚至1975年)的 LTPA 習慣在未來的四十年間保持不變。
這只是運動數據的一部分。有多少人能夠在65歲時擁有與25歲相同的身體質量指數 (BMI) ?有多少在1970年代吸菸的人可能在隨著負面健康影響的意識提高後戒煙?又有多少具有重大健康影響的變數在本研究中完全未被評估?如身體組成、血壓、社會經濟地位、遵守癌症檢查指引等?
即使將體育活動問卷限定於休閒時間活動,我們對該研究最關鍵的變數仍然是一個不完整的畫面 —舉例來說,那些職業舞者、健身教練、消防員或其他日常工作極為活躍的工作者,是否會被排除在專門詢問業餘活動的問卷之外?
這種情況似乎相當可能,尤其考慮到約90%的參與者平均每日 MET 小時數小於4 —大致相當於一小時的園藝活動(根據“MET小時”定義,這樣的數據幾乎不可能,因為一個 MET小時定義為一小時靜止狀態下的能量消耗)。
有問題的分析與解釋
假設本研究中的問卷確實完整且準確地描繪了每位參與者的健康和體育活動情況,並且所有參與者的習慣和健康指標在隨後的30–45年間沒有發生重大變化。即使這樣,我們仍無法對 LTPA 本身對死亡風險的影響結論抱有任何信心。
作者指出,調整 BMI、教育水平、吸菸和酒精消費的共變量後,三個活動組與久坐組之間的風險差異有所縮小,但在適度活動和活動組中仍然具有統計學意義。
只有高度活動組與久坐組的比較失去統計學顯著性,這只是因為這兩組的參與者數量遠小於中間兩組,這增加了置信區間的寬度,以至於超出統計學顯著性的限制,但相關性的方向仍然支持高活動。
最令人沮喪的部分可能在於該模型中排除了在1990年之前報告有心絞痛、心臟病或糖尿病史的參與者的分析 —
即該模型顯示相較於久坐組,任何活動組的 LTPA 對死亡率均無影響。許多研究會在基線時排除有健康狀況的參與者,這通常是可以接受的做法 —
但前提是「基線」發生在關注的暴露因素之前。
在本研究中,死亡率(即研究的主要結果)的「基線」定義為暴露因素數據收集的結束(即 LTPA),這意味著1990年時各組之間的健康差異可能是由 LTPA 的差異引起的。
換句話說,在死亡率追蹤前15年中處於久坐狀態的參與者可能比更活躍的群體更容易患有心絞痛、心臟病發作或糖尿病,但排除這些參與者後,久坐組僅剩下最健康的亞群體,而活動組中則呈現出更廣泛的健康光譜。這構成了一種稱為「資訊性審查」的偏倚,其中研究組別由與結果直接相關的變數定義。
關於預印本的說明
此時,值得提醒的是,該研究的手稿以預印本形式發表 —這意味著在發表前尚未經過同行評審(截至目前,仍未通過同行評審過程)。
預印本在科學研究中具有重要意義,因為它們允許研究人員快速分享結果(避免了通常耗時數月或數年的同行評審過程)。此外,由於預印本服務平台通常不設付費牆,這些研究結果更有可能接觸到更廣泛的受眾。這些優勢在研究人員需要傳達高影響力和時間敏感的結果時尤為重要 —例如在 COVID-19 大流行期間,相關研究常在同行評審前被分享。
預設的假設是預印本提交的手稿隨後會在經過同行專家審查質量並提出修改建議後發表於同行評審期刊。然而,許多預印本並未經過這一嚴格的審查過程,即便如此,其呈現的信息仍然被媒體和社交平台報導和分享,好像已通過專家審查一樣,這增大了廣泛誤傳的風險。
我強烈懷疑這次的研究也會如此。事實上,這項工作的預印本已於一年多前釋出,而我的團隊最初也在等待同行評審版本以進行批判,但現在看來這樣的發表很可能無法實現。然而,相關故事和頭條仍然在傳播。這就是媒體報導預印本時的問題(更不用說媒體報導科學時,如果他們缺乏理解所報導內容的細節能力會有什麼問題)。
吸引注意但無法改變格局
多條證據線支持著運動對健康和長壽有益的長期且廣泛的共識。我們過去多次涵蓋過這類證據的不同部分(例如此處、此處、和此處)。
因此,那些聲稱挑戰如此既定(且有充分支持)健康原則的報告雖然能夠吸引注意(並因此登上媒體頭條),但儘管相反觀點具有引人注目的點擊誘餌吸引力,僅因它們是相反意見並不意味它們具有可靠性。事實恰恰相反 — 它們必須具備無可爭辯的證據以克服對常識的廣泛支持。
這項研究遠遠沒有達到這個高標準。事實上,它甚至可能未達到發表於一個值得尊敬的同行評審期刊的標準。因此,儘管新穎性和顛覆傳統觀點可能會吸引注意,正如莎士比亞所言,「所有閃光的東西並非黃金。」
正如莎士比亞所言,「所有閃光的東西並非黃金。」
原文作者:Kathryn Birkenbach, Peter Attia
節錄翻譯與編輯:蔡奇儒