短期飲食試驗錯誤:新研究揭示飲食順序對結果的巨大影響

本翻譯僅作學術交流用,無商業意圖,請勿轉載,如有疑議問請來信

這項研究重新分析了一個沒有間隔期的2週交叉飲食試驗,發現飲食順序對能量攝取和體脂有顯著影響。低碳水化合物飲食先進行時,能量攝取明顯減少,體脂降低;相反,先進行低脂肪飲食則導致能量攝取增加。這些結果挑戰了以往的認知,並為飲食研究帶來新的見解。

Physiologic Adaptation to Macronutrient Change Distorts Findings from Short Dietary Trials: Reanalysis of a Metabolic Ward Study

短期飲食試驗中的生理適應性對宏量營養素變化的影響:代謝病房研究的重新分析

Soto-Mota A, Jansen LT, Norwitz NG, Pereira MA, Ebbeling CB, Ludwig DS. Physiologic Adaptation to Macronutrient Change Distorts Findings from Short Dietary Trials: Reanalysis of a Metabolic Ward Study. J Nutr. 2024;154(4):1080-1086. doi:10.1016/j.tjnut.2023.12.017

https://pubmed.ncbi.nlm.nih.gov/38128881/

Abstract

An influential 2-wk cross-over feeding trial without a washout period purported to show advantages of a low-fat diet (LFD) compared with a low-carbohydrate diet (LCD) for weight control. In contrast to several other macronutrient trials, the diet order effect was originally reported as not significant. In light of a new analysis by the original investigative group identifying an order effect, we aimed to examine, in a reanalysis of publicly available data (16 of 20 original participants; 7 female; mean BMI, 27.8 kg/m2), the validity of the original results and the claims that trial data oppose the carbohydrate–insulin model of obesity (CIM). We found that energy intake on the LCD was much lower when this diet was consumed first compared with second (a difference of −1164 kcal/d, P = 3.6 × 10-13); the opposite pattern was observed for the LFD (924 kcal/d, P = 2.0 × 10-16). This carry-over effect was significant (P interaction = 0.0004) whereas the net dietary effect was not (P = 0.4). Likewise, the between-arm difference (LCD – LFD) was −320 kcal/d in the first period and +1771 kcal/d in the second. Body fat decreased with consumption of the LCD first and increased with consumption of this diet second (−0.69 ± 0.33 compared with 0.57 ± 0.32 kg, P = 0.007). LCD-first participants had higher β-hydroxybutyrate levels while consuming the LCD and lower respiratory quotients while consuming LFD when compared with LFD-first participants on their respective diets. Change in insulin secretion as assessed by C-peptide in the first diet period predicted higher energy intake and less fat loss in the second period. These findings, which tend to support rather than oppose the CIM, suggest that differential (unequal) carry-over effects and short duration, with no washout period, preclude causal inferences regarding chronic macronutrient effects from this trial.

摘要

一項具有影響力的兩週交叉餵食試驗未設置洗滌期,據稱顯示低脂飲食(LFD)相比低碳水化合物飲食(LCD)在體重控制方面的優勢。與其他幾個宏量營養素試驗相比,最初報告的飲食順序效應並不顯著。鑑於原調查小組的新分析確定了順序效應,我們旨在重新分析公開數據(原始20名參與者中的16名;7名女性;平均BMI為27.8 kg/m²),檢驗原始結果的有效性及試驗數據反駁碳水化合物-胰島素肥胖模型(CIM)的主張。我們發現,當LCD首先被消耗時,其能量攝入量顯著降低(每天下降1164千卡,P = 3.6 × 10^-13);而LFD則出現相反的模式(增加924千卡,P = 2.0 × 10^-16)。這種攜帶效應顯著(P 互動 = 0.0004),而淨飲食效應則不顯著(P = 0.4)。同樣,第一階段的兩組之間差異(LCD – LFD)為 -320 千卡/天,第二階段為 +1771 千卡/天。第一階段食用LCD時體脂減少,第二階段則增加(-0.69 ± 0.33 公斤相比0.57 ± 0.32 公斤,P = 0.007)。LCD首先參與者在食用LCD期間β-羥丁酸水平較高,而在食用LFD期間呼吸商較低。第一飲食階段的胰島素分泌變化(以C-肽評估)預測第二階段的更高能量攝入和較少脂肪減少。這些發現支持而非反駁CIM,表明不同的(不平等的)攜帶效應和短期無洗滌期的試驗,阻礙了對慢性宏量營養素效應的因果推論。

引言

飲食中的宏量營養素組成,特別是脂肪與碳水化合物的比例,是否會長期影響一般人群的體重?這一問題的答案對於科學理解肥胖的病因及公共健康預防工作具有重大意義。然而,儘管有超過一個世紀的研究,宏量營養素組成對體重的影響仍然是未解的爭議。

大多數有關宏量營養素和體重的臨床研究採用兩種設計之一,這兩種設計各有其優點和限制。觀察性研究可以檢視大群體中飲食或飲食變化的長期關係,這對於公共健康預防具有潛在的相關性。然而,這些研究存在多種方法學問題,重要的包括飲食評估錯誤、混淆因素和反向因果關係。長期行為試驗中,參與者可隨機分配到兩種或更多對比飲食,持續數月或數年,從而降低(但不消除)混淆和其他偏差的風險。這些試驗通常依賴低強度干預,如團體營養教育和有限跟進及過程測量的飲食指導,這無法在治療組間引發強烈、持久的飲食區別。不意外地,它們傾向於顯示各類型飲食對體重減輕的長期效果有限。

通過提供準備好的餐食和嚴格控制潛在的混淆因素,住院餵食研究旨在產生支持因果推論的高質量證據。然而,出於現實和成本考量,這些試驗通常時間短(即不超過兩週),並且存在其他方法學和設計上的問題,可能限制這些試驗急性效應在一般人群中的長期推廣。

在最近的一項代謝病房餵食研究中,20名參與者被隨機分配到等熱量的LCD或LFD,使用交叉設計,為期兩週且無洗滌期。平均能量攝入和脂肪質量在LCD組較高,這些發現被解釋為反對碳水化合物-胰島素模型(CIM)的肥胖理論。在CIM中,高升糖負荷飲食(含大量快速消化的碳水化合物)在餐後階段增加胰島素與胰高血糖素的比率,改變底物分配,從瘦體器官的氧化轉向脂肪組織的沉積。因此,過度飲食及隨之而來的正能量平衡是肥胖增加的結果而非原因。因此,CIM針對高升糖負荷碳水化合物,而非總卡路里攝入,來預防和治療肥胖。

在原始文章中,作者報告沒有攜帶效應的存在,因此在數據解釋中未考慮其潛在影響。這與其他幾份報告中觀察到的主要營養素攝入變化後持續數週或更長時間的生理變化形成對比。在最近的一次科學會議和一篇線上預印本中,原調查小組提出了存在攜帶效應的證據。有了這些修正資訊的幫助,我們重新分析了可用的個別參與者數據,以確定主要發現是否仍然有效。

試驗干預及原始結果

在試驗(NCT03878108)中,21名成年人被隨機分配到“以動物為基礎的生酮飲食”或“以植物為基礎的低脂飲食”,在住院研究單位進行2個為期2週的飲食期,採用交叉設計且無中間洗滌期。一名參與者退出,剩下20名參與者進行主要結果分析(9名女性;平均年齡29.9歲;平均BMI為27.8)。提供的LCD和LFD的宏量營養素組成比例為:LCD的碳水化合物10%、脂肪76%,而LFD的碳水化合物75%、脂肪10%,兩者的蛋白質均約為14%。除了提供的食物外,參與者可以隨意攝取分配的飲食。試驗的主要結果是總能量攝入,在食用LCD時較高(每日增加689千卡,P < 0.0001)。

公開試驗數據的評估

我們從開放科學框架獲取個別參與者數據[Hall KD. Data and SAS code [Internet]. OSF; 2022. Available at https://osf.io/zdwqb/]. 由於部分參與者反對數據共享,原始研究分析中包含的4名參與者的大部分數據從註冊表中刪除,這在一定程度上降低了我們重新分析的統計力量。剩餘的16名參與者的基線特徵與原始20名參與者相似,如表1所示。忽略攜帶效應,對這16名參與者的能量攝入結果計算與原始報告的結果相似(飲食效應為695千卡/天)。

表1. 原始報告中參與者和可用數據集的基線特徵

攜帶效應使用線性模型中的飲食*周期交互項進行測試。作為敏感性分析的一部分(並考慮到原始研究的縱向設計),還使用了個體斜率的調整線性混合效應模型。我們使用R版本4.0.3和R Studio版本2023.06.01-Build 524進行所有分析,包括截至2023年9月更新至最新版本的軟件包。數據以平均值±標準誤表示,除非另有說明。本次對公開數據的重新分析不需要額外的機構審查委員會批准(超出原始試驗論文中描述的批准)。

能量攝入與身體成分

在使用參與者之間比較的重複測量模型中,當LCD首先被食用時,其平均能量攝入量顯著低於第二次食用時(差異為−1164千卡/天,P = 3.6 × 10^-13),如圖1所示。相反,當LFD首先被食用時,其平均能量攝入量顯著較高(924千卡/天,P = 2.0 × 10^-16)。使用線性混合效應模型也得出了質量上一致的結果(請參閱公開的代碼)。同樣,在第一階段的兩組之間差異(LCD – LFD)為−320千卡/天,第二階段為+1771千卡/天。同樣,當首先食用LCD時,體脂減少,而第二次食用LCD時體脂增加(−0.69 ± 0.33 公斤相比0.57 ± 0.32 公斤,P = 0.007),如圖2所示。

圖1. 測試飲食的每日能量攝入按飲食順序劃分。(A)低碳水化合物飲食。(B)低脂飲食。實線表示首先食用該飲食;虛線表示第二次食用該飲食。參與者數量 n = 16。 圖2. 測試飲食下體脂變化按飲食順序劃分。(A)低碳水化合物飲食。(B)低脂飲食。實線表示首先食用該飲食;虛線表示第二次食用該飲食。參與者數量 n = 16。

在未考慮攜帶效應的單變量線性模型中,LCD順序對兩個結果的預測能力顯著優於飲食組成(LCD對比LFD)。LCD順序的R²是飲食組成的兩倍以上(能量攝入的R²分別為29%和12%;脂肪減少的R²分別為8%和3%)。為了解決攜帶效應問題,我們對能量攝入進行了線性模型交互測試。該模型顯示出一個非常大的攜帶效應(飲食效應在兩個周期之間的差異為2090千卡/天,P = 0.0004),而淨飲食效應則不顯著(P = 0.4)。在考慮個體斜率和基線BMI、性別、靜息能量消耗等潛在混淆因素的調整後,這些發現在線性混合效應模型中並無實質性差異。

酮體生成與呼吸商

上述分析顯示的攜帶效應提供了檢查相關代謝適應的機會。β-羥丁酸(βOHB)是主要的血清酮體,也是碳水化合物受限(生酮)飲食代謝適應的重要組成部分。首先食用LCD的參與者相比第二次食用LCD的參與者,其血液中的βOHB濃度顯著較高(P = 0.008)。此外,首先食用LCD的參與者在食用LFD時,其呼吸商(RQ)顯著較低,表明其脂肪氧化率更高(P = 0.01)(如圖3所示)。然而,這些分析並未區分代謝變化是由飲食順序導致的能量攝入差異引起、結果、還是與其相互作用。

圖3. 測試飲食下的代謝變量按飲食順序劃分。(A)低碳水化合物飲食期間的血液β-羥丁酸濃度。(B)低脂飲食期間的呼吸商。P 值通過單變量線性模型獲得,參與者數量 n = 16。

通過第1階段胰島素分泌預測第2階段的能量攝入和脂肪質量

CIM假設高胰島素分泌促進底物分配至脂肪組織,導致脂肪增加及其必然伴隨的正能量平衡。由於宏量營養素組成可能影響胰島素清除率,從而影響血清濃度,我們使用C-肽來檢驗這一假設。C-肽濃度的變化(胰島素分泌的衡量標準)從基線到第一飲食期結束,與自由攝取能量攝入相關 [β = 1780 kcal/d(95% CI: 750, 2811 kcal/d)每ng/mL的C-肽變化;R² = 0.41;P = 0.004] 和脂肪質量的變化 [β = 1.36 kg(95% CI: 0.3, 2.5 kg)每ng/mL的C-肽變化;R² = 0.26;P = 0.026] 在第二飲食期,C-肽的較大減少預測了較好的反應(如圖4所示)。

圖4. 通過第一飲食期C-肽變化預測第二飲食期的結果。(A)平均能量攝入。(B)脂肪質量變化。P 值通過單變量線性模型獲得,參與者數量 n = 16。

對原始試驗因果推論的影響

許多飲食和環境因素在短期內影響體重,但不會長期影響,這些因素範圍從嚴格的卡路里限制到餐盤的大小和顏色。然而,這些短暫影響,無論是心理行為上的還是生理上的,對於理解肥胖的病因或設計更有效的公共健康干預措施幫助不大。我們的分析表明,原始試驗報告中的主要效應存在這一問題,突顯了短期餵食研究的缺陷,儘管這些研究能夠在若干關鍵實驗條件下實現嚴格控制。

我們發現,飲食的消費順序對研究結果有主導作用,遠超過飲食本身的影響。為了具體化這個問題,可以將LCD和LFD分別視為兩種不同的暴露。首先食用的LCD比第二次食用的LCD減少了1164千卡/天的食物攝入量,而LFD則呈現相反的模式(第一次比第二次多924千卡/天)。這些發現顯示出顯著的不同(不平等)的攜帶效應。

攜帶效應的性質對因果推論有根本性的影響。一種常見的攜帶效應形式是非差異性的。即無論治療順序如何,參與者在第一期的反應會始終比第二期更好或更差。這種情況可能因學習(在實踐後第二期反應更好)或厭倦(第二期反應更差)而產生。這類攜帶效應可以通過交叉試驗中固有的個體內比較來識別。關鍵的是,在這種情況下,偏差可以從治療效應中區分出來,並通過平衡隨機治療分配來預防。

更令人擔憂的一種攜帶效應是差異性的,即治療對彼此具有不平等的影響。在最嚴重的情況下,一種治療的殘餘效應可能與另一種治療的效應相反,如在這次試驗中顯而易見的情況。差異性攜帶效應對交叉研究的有效性構成了潛在的致命威脅,特別是在此處使用的2×2設計中。根據Wang和Hung的說法,“(差異性)攜帶效應與治療期交互和順序效應完全混淆。”因此,根據Hill和Armitage的說法,“將治療效應與前一治療期的時間和攜帶效應區分開來的任務可能是困難甚至不可能的。”強調這一核心方法學限制,Putt觀察到:“在交叉研究中,對治療效應的測試從個體內比較中獲得效率。相反,對攜帶效應的測試基於個體間的對比,相對於治療效應的測試其力量較弱。如果發生攜帶效應,這種低力量使得檢測困難。”

由於這一限制,可能需要多次重複試驗以識別甚至相對較大的差異性影響(例如,治療效應的25%-50%)。實際操作中,通常使用洗滌期來最大限度地降低臨床相關偏差的風險。然而,這裡可以通過其巨大規模(數倍於假定治療效應)使用個體間比較來清楚地區分攜帶效應。由於這種效應無法與治療效應分開,試驗的因果推論條件未得到滿足,LCD與LFD的主要結果比較無效。

在這裡發生的重大差異性攜帶效應下,唯一有效的測試是在第一治療期進行的個體間比較,捨棄第二期的偏差數據。儘管樣本量不足,這些測試顯示LCD相比LFD具有優勢,與原始報告的結果相反,能量攝入在兩週內平均(2251比2570千卡/天,P = 0.36),第二週能量攝入(2061比2582,P = 0.0003)和總脂肪質量變化(−0.43比−0.29公斤,P = 0.75)。

不平等攜帶效應的生理機制

宏量營養素消耗的顯著變化會引起激素分泌、基因表達、組織特定代謝途徑和心理行為反應的多種適應性變化。根據廣泛的動物和人類研究證據,這一適應過程似乎需要幾週到幾個月的時間才能在新飲食上重新建立平衡。在此期間,生物和行為結果的測量可能反映的是短暫現象,而非慢性宏量營養素效應。

先前食用LCD會降低葡萄糖耐受性,並通過推測降低口服葡萄糖耐量測試中的胰島素分泌和/或敏感性,這一現象已經觀察了近一個世紀。在最近的一項研究中,從生酮LCD飲食轉換到高碳水化合物飲食後,葡萄糖穩態的多項指標在1至2個月內發生了漸進變化。相反,適應LCD的過程在習慣於高碳水化合物飲食的人群中似乎需要至少2至3週,可能還需要更長時間。在一項LCD餵食試驗的薈萃分析中,試驗持續時間少於2.5週的總能量消耗略有下降,但在較長時間的試驗中顯著增加。這一短暫適應過程的額外證據是原始試驗報告中第一週到第二週(兩個周期)的日常能量攝入差異逐漸減少,如果線性外推,則在再過2週後可能消失。

對碳水化合物-胰島素模型的影響

儘管試驗本身存在內在局限,我們的發現傾向於支持,而非反駁CIM。對第一飲食期第二週的能量攝入進行無偏測試(即在1週的代謝適應後)顯示LCD具有顯著的優勢(能量攝入減少521千卡/天,P = 0.0003)。此外,先前食用LCD在隨後的LFD期中具有持續的有益效果,能量攝入和呼吸商(RQ)較低。相反,先前食用LFD在隨後的LCD期中具有持續的不利影響,能量攝入和脂肪增加,酮體生成減少。此外,第一飲食期中的胰島素分泌測量解釋了第二飲食期中食物攝入(41%)和脂肪質量變化(26%)的顯著異質性,這與CIM的假設一致,考慮到這些結果的內部和個體之間的多種變異來源以及測量不精確。

結論

總之,需要來自互補研究線索的高質量證據來解決有關宏量營養素組成與肥胖的長期爭議,並測試CIM。餵食研究可能對此證據有重要貢獻,但這些研究必須持續足夠長的時間,以區分短暫適應反應與慢性效應。

我們的發現對於國立衛生研究院的新精準營養計畫提出了擔憂,該計畫計劃大規模投資於具有2週飲食期的交叉餵食試驗(clinicaltrials.gov標識符NCT05701657)。儘管這些試驗將包含洗滌期,但2週的最低指定持續時間似乎不足以排除來自攜帶效應的主要偏差。除了攜帶效應,2週飲食期的結果似乎不太可能闡明宏量營養素的長期代謝效應,或為臨床和公共健康領域的飲食選擇提供信息。

對於所有試驗,應在試驗飲食期間持續至少1至2個月後收集能量攝入和消耗等結果,基於可用的宏量營養素變化代謝適應時間框架數據。對於交叉試驗,應設置至少3個月的洗滌期,以便攜帶效應消退。身體成分的測量反映了適應期間和之後的累積效應,這需要更長時間的研究,至少6個月。誠然,這類試驗對研究人員和參與者來說涉及重大後勤和其他挑戰。為減少這些障礙,應開發創新的研究方法,如與寄宿教育機構、軍隊合作,或在適當的倫理保護下,與監獄合作。最後,我們的重新分析得益於原始研究人員的開放數據訪問,這突顯了完全試驗數據開放訪問對學術論述的重要性。

參考文獻