381
這篇文章探討了環境和基因因素對衰老和死亡率的影響。研究人員分析了英國生物銀行近50萬人的數據,發現25種獨立的環境因素與死亡率和蛋白質組學年齡時鐘相關,這些因素也與年齡相關的多種疾病、老化生物標記和主要疾病風險因素相關。
重要提問
Q1環境和基因哪個更重要?
Q2: 什麼是蛋白體生物時鐘?蛋白體年齡差距又是什麼?
Q3: 環境因素和基因分別對哪些疾病影響比較大?
Q4: 研究發現了哪些重要的環境風險因子?
Q5: 哪些環境因素對早逝的影響最大?
Q6: 環境因子如何影響老化?與疾病和蛋白體老化標記的關聯程度有多大?
內容目錄
內容目錄
Integrating the environmental and genetic architectures of aging and mortality
文獻出處
背景
- 老化的複雜性:人類老化起初以亞臨床與生物性變化呈現,從中年開始累積,最終導致常見年齡相關疾病與多重病症,並成為全球早逝的主要原因。
- 遺傳因素影響有限:儘管遺傳研究顯示與年齡相關疾病的複雜基因病因,單一基因變異對壽命的影響仍屬薄弱,累積效應雖可增加風險,但整體解釋力有限。
- 環境因素決定性作用:全球壽命在200年內幾乎翻倍,而人類基因組基本保持穩定,所以非遺傳的環境曝露(exposome)在衰老與早逝中的關鍵角色。
- 蛋白質組學老化時鐘(Proteomic Aging Clock):蛋白質組學老化時鐘提供了一種準確描述和測量老化生物學特徵的方法,這個時鐘高度預測死亡率和大多數主要慢性疾病的發生風險。
- 創新研究方法:
- exposome-wide 分析:利用UK Biobank資料(n = 492,567)系統性檢視所有環境曝露,找出與早逝獨立相關的因素。
- phenome-wide 分析:針對每個死亡相關曝露進行廣泛檢驗,排除干擾因素與測量誤差。
- 蛋白質生物年齡時鐘:在45,441名受試者中運用該工具,驗證曝露與老化生物學的直接關聯。
- 階層聚類法:透過分解曝露因子間的高度相關性,確保各環境因子具獨立性。
- 綜合評估環境與遺傳貢獻:研究量化了環境曝露與基因(genome)在解釋早逝、25項主要年齡相關疾病、25項生化生物標記以及肥胖、高血壓、血脂異常這三大疾病風險因子變異上的相對影響。
- 研究意義與臨床應用:本研究填補了以exposome-wide設計探討環境與衰老生物學間關聯的空白,提供實證支持未來以環境介入為主的預防策略,有助於延緩老化與降低早逝風險,為臨床與公共衛生政策制定提供重要依據。
研究方法
研究設計與參與者:
- UK Biobank (UKB): 前瞻性世代研究,包含 502,505 名英國居民的基因和表型數據。
- 所有統計分析皆使用R v.4.2.2與PLINK v.2.0進行。
暴露因素
- 暴露因素選擇:截至2020年7月24日,所有非基因變量(如空氣污染和Townsend剝奪指數)在基線收集或衍生,缺失值小於80%,且在所有評估中心的參與者中可用,作為XWAS的潛在暴露因素。經過排除、重新編碼和質量控制後,剩餘176個獨特的暴露因素。
Outcomes (結果變數)
- 死亡率數據:與國家登記處的死亡和死因信息鏈接。
- 蛋白質組學老化計算:老化生物標誌物使用基線非空腹血液血清樣本測量。白細胞端粒長度數據僅在稍小的樣本(n = 472,506)中可用。
- 慢性疾病和常見疾病風險因素的定義:新發慢性疾病診斷使用國際疾病分類(ICD)診斷代碼和對應的診斷日期,從鏈接的醫院住院記錄和死亡登記數據中獲取。
XWAS(環境廣泛關聯研究)
- 全因死亡XWAS最初分別於女性與男性中進行,最終在合併資料集中計算以增加檢驗力。
- 合併XWAS僅包含適用於男女皆通用之曝露,排除性別特定生殖因素(僅於性別特定XWAS中測試)。
- 每項曝露與全因死亡之關聯以Cox比例風險模型測試,時間尺度為年齡,並以5年出生與性別分層,同時調整評估中心、教育年數(7、10、13、15、19及20年)與族群(白人、亞洲人、黑人、混血或其他)等相關因素。
- 發現組與重複驗證組的P值均以FDR(Benjamini–Hochberg方法)校正,顯著性門檻設定為FDR P<0.05。
- 完成全因死亡XWAS後,將發現組與重複驗證組重新合併為完整英格蘭樣本(n=436,891),以進一步進行敏感性分析。
既往疾病敏感性分析
- 在完整英格蘭樣本(n=436,891)中,對每項在合併死亡XWAS中重複的曝露,再次以相同XWAS模型及協變量測試其與死亡的關聯,並額外加入曝露與基線疾病或健康不良指標之交互作用。
- 若某曝露在此模型中直接效應不顯著(P<0.05),但其與健康不良指標交互作用顯著(P<0.05),則該曝露將被標記並排除進一步分析。
- 基線疾病/健康不良指標根據以下條件建立:
- 參與者於基線前或當天有連結醫院住院ICD診斷碼記錄任一慢性疾病或常見風險因子(包括高血壓、血脂異常及肥胖);
- 基線訪談中被分配任一慢性疾病或風險因子診斷碼;
- 自報曾有醫師診斷心臟病發作、心絞痛、中風、高血壓、支氣管炎/肺氣腫、糖尿病或癌症;
- 自報至少一項癌症診斷;
- 自報服用胰島素、降膽固醇或降血壓藥物;
- 自評整體健康狀態為「差」。
PheWAS分析
- PheWAS實施:對於在XWAS中呈現且未在上述疾病敏感性分析中刪除的暴露因素,進行PheWAS。在每個PheWAS中,暴露因素作為結果變量(以下稱為暴露結果),並與資料庫中可用的全部基線表型進行測試。
- 分析方法:每個PheWAS根據暴露結果是連續還是分類進行線性或邏輯回歸分析,共變數包括招募年齡和性別。所有有序暴露結果均作為連續變量測試。名
蛋白質組學年齡時鐘分析
- 分析方法:依次評估每個暴露因素與蛋白質組學年齡差距(血漿蛋白預測年齡與實際年齡之間的差值)之間的關聯,使用截面線性回歸模型,共變量包括性別、招募年齡、評估中心、教育年限和種族。
- 蛋白質組學年齡時鐘開發:先前在資料庫的一部分參與者(n = 45,441)中使用機器學習模型開發了蛋白質組學年齡時鐘,該模型使用204種蛋白質準確預測實際年齡(Pearson r = 0.94)。在中國(n = 3,977)和芬蘭(n = 1,990)的生物庫驗證研究中,蛋白質組學年齡時鐘顯示出類似的年齡預測準確性(Pearson r = 0.92和r = 0.94),。
- 與疾病和死亡率的關聯:蛋白質組學年齡時鐘先前已與18種主要慢性疾病(包括心臟、肝臟、腎臟和肺部疾病、糖尿病、神經退行性疾病和癌症)的發生以及多病共存和全因死亡率風險相關聯。
相關性和聚類分析
- 相關性計算:使用R包polycor計算所有變量之間的相關性,
- 聚類分析:計算不同聚類數量(k)範圍從1到25的階層聚類。確定七個聚類解決方案是WSS曲線肘部的最佳近似,並代表暴露因素的最恰當概念分組。
- 多變數建模:在這七個聚類中的每一個中進行多變數建模:
- 共線性檢查
- 多變數分析:刪除共線性變量後,聚類內所有剩餘暴露因素一起在單個多變數死亡率Cox模型中測試,使用年齡作為時間尺度,按5年出生和性別分層,並控制評估中心、家庭收入、教育和種族因素。
老化機制和新發慢性疾病分析
- 老化生物標記分析:老化生物標記變量進行對數轉換,然後通過在女性和男性中分別回歸招募年齡進行年齡調整。在XWAS中複製且通過所有敏感性測試的暴露因素中,依次評估每個暴露因素與年齡調整後生物標誌物之間的關聯,使用截面線性回歸模型,共變量包括性別、5年出生隊列、評估中心、教育年限、種族、用藥數量、吸菸狀態和IPAQ身體活動水平。IGF-1、白細胞端粒長度和維生素D模型中新增站立身高、白細胞計數和生物標誌物評估月份(以控制陽光暴露的季節性)作為協变量。
- 慢性疾病分析:依次評估每個暴露因素與新發疾病之間的關聯,使用Cox危險模型,所有XWAS共變量加上家庭收入、吸菸狀態和IPAQ身體活動組。性別特異性生殖暴露(如更年期)在女性和男性特異性慢性疾病結果分析中也作為暴露因素進行測試。
- 常見疾病風險因素分析:依次評估每個暴露因素與常見疾病風險因素(肥胖、高血壓和血脂異常)之間的關聯,使用截面邏輯回歸模型,校正年齡、性別、評估中心、家庭收入、教育年限、種族、吸菸狀態和IPAQ身體活動水平。
- 結果校正:P值分別對每個結果使用FDR進行校正。
多基因風險評分(PRS)計算
- PRS計算:使用UKB v3插補基因型數據,將這些PRS計算為加權和,∑(風險等位基因數×效應大小)。用於計算PRS的PGS包括白血病、肺癌、胰腺癌、食道癌、COPD、慢性腎病、非酒精性脂肪肝病、肝硬化和膝骨關節炎。
- PRS編碼:所有PRS均編碼為五分位數,以供多變數模型使用。
環境暴露和多基因風險的多變數模型
- 模型計算:對於每個結果,計算五個多變數模型。
- 模型1僅包括年齡(縮放)和性別。
- 模型2包括年齡、性別和結果的PRS。
- 模型3包括年齡、性別和與結果相關的所有暴露因素(環境暴露)
- 模型4包括年齡、性別、環境暴露和PRS。
- 模型在獨立的蘇格蘭/威爾斯數據集(n = 55,676)中進行驗證,通過獲取模型在英格蘭數據集中的線性預測值,並測量這些值與蘇格蘭/威爾斯人群中結果率之間的C指數和R²。
結果
研究參與者與死亡率
- 研究規模:本研究包含492,567名英國生物銀行(UK Biobank, UKB)參與者,其中436,891名來自英格蘭,55,676名來自蘇格蘭/威爾斯。
- 死亡人數:在英格蘭招募的參與者中,經過中位數12.5年的追蹤,共有31,716人因各種原因死亡。
- 早逝比例:74.5%的死亡為早逝(即在75歲之前發生)。
- 性別差異:女性的全因死亡率低於男性(女性為5.4%,男性為9.4%)。
- 疾病發生率:在英格蘭招募的參與者中,常見年齡相關疾病的發生案例數從856例(腦癌)到45,879例(骨關節炎)不等。
Exposome-wide分析與死亡率
- Exposome-wide關聯研究(XWAS):使用Cox風險模型,連續測試164種環境暴露與全因死亡率之間的關係。
- Exposome 指的是個體從出生到死亡,一生中接觸到的所有非基因環境因素的總和。
- 外部環境暴露:僅調查外部環境暴露,內部對暴露的生化反應未包含在內,並排除已診斷疾病的治療暴露(如藥物和藥品使用)。
- 研究設計:
- 研究團隊採用 Exposome-wide association study (XWAS) 方法,在英國生物樣本庫 (UKB) 中進行。
- 將研究對象分為獨立的「發現組」和「驗證組」,增加結果可信度。
- 使用 Cox 比例風險模型分析 164 種環境暴露與全因死亡率的關係。
性別差異:
- 研究發現,在分別分析男性和女性的 XWAS 回歸係數時,沒有觀察到顯著差異。
主要發現 (綜合男女數據):
- 164 種暴露中,有 110 種 (67.1%) 在驗證組中得到重複驗證。
- 增加死亡風險:
- 吸菸 (Smoking):無庸置疑,吸菸是最大的危險因子。
- 公共租賃住房 (Renting public housing):相較於自有房屋,租屋者死亡風險較高。
- Townsend 剝奪指數 (Townsend deprivation index):反映社會經濟地位,指數越高,死亡風險越高。
- 降低死亡風險:
- 與伴侶同住 (Living with a partner):相較於獨居或與非伴侶同住,有伴侶者死亡風險較低。
- 家庭車輛數量 (Number of household vehicles):可能反映經濟狀況和生活便利性。
- 就業 (Being employed):有工作者死亡風險較低。
- 家庭收入 (Household income):收入越高,死亡風險越低。
排除已經存在的疾病的影響
- 排除追蹤期前四年死亡的資料
- 檢測每個暴露與基線健康狀況不佳指標之間的交互作用。
- 進一步的敏感性分析: 排除可能受既有疾病影響的 15 種暴露,最終保留 95 種暴露。
殘留混雜因素的檢測
- 混雜因素是指與「暴露」和「結果」都有關聯,但並非研究對象的因素。如果沒有妥善控制,可能會扭曲暴露與結果之間的真實關係。
- Phenome-wide關聯研究(PheWAS):針對95個複製的暴露因素,進行PheWAS,將暴露因素作為結果變數,與UK生物資料庫中所有基線表型進行回歸分析(使用邏輯回歸或線性回歸)。
- 發現強關聯的暴露因素:進一步檢測到10個與疾病、衰弱或失能表型,或其他暴露因素極強相關的暴露因素,這些可能不代表獨立因子。
- 具體例子:例如,在XWAS中與死亡率最顯著相關的暴露因素之一——家庭車輛數量(死亡風險比(HR)0.39,P = 5.2 × 10^-155),與更高的家庭收入(β = 1.1,P < 8.1 × 10^-12)極強相關,而與居住在公租房相比自有住房(β = -0.98,P < 5 × 10^-56)和因殘疾失業(β = -0.62,P < 1.4 × 10^-245)呈負相關。這些發現表明,家庭車輛數量與死亡率之間的關聯可能由社會經濟和失能狀況的混雜所解釋。
- 排除混雜因素:所有在PheWAS中顯示有殘留混雜的暴露因素均被排除後,最終剩餘85個暴露因素
與生物老化相關的暴露因素
- 方法:利用已建立的蛋白質生物年齡時鐘(proteomic age clock),該工具已證實與死亡、18項主要慢性老化相關疾病(含非癌症疾病與部分癌症)、多重病症及老化相關表型(如衰弱指數、認知功能)存在關聯。
- 測量指標:採用「蛋白質年齡差距」,即參與者蛋白質預測年齡與實際年齡的差值,來評估每項曝露對老化生物學的影響。
- 曝露篩選標準:若某項曝露與蛋白質老化無顯著關聯或與死亡效應方向相反,則判定該曝露可能對老化生物學無影響或受混雜效應的影響。
- 篩除結果:在85項曝露中,有57項因不符合顯著性(經FDR校正)或呈現相反方向效應而被剔除,其中包括部分飲食曝露(酒精、肉類、穀物纖維、鹽、多種維生素及葡萄糖胺補充劑)、心理健康、空氣污染、綠地曝露以及某些社交互動。
- 最終保留的曝露因素:最終剩下28項曝露因素,在FDR p值<0.05的考驗下,與早逝及蛋白質老化均呈現相同方向的顯著關聯。
降維與相關性結構調整
- 目的: 處理暴露變數間的相關性 (共線性),找出獨立影響死亡率的暴露。
90% 的變數配對顯示顯著相關 (Bonferroni 校正後 P < 0.001)。
- 解決方法:
- 階層式分群 (Hierarchical Clustering):將通過 XWAS 驗證和敏感性分析的 28 個暴露分群,分為 7 個獨特的群組。
- 群組內多變數模型 (Multivariable Mortality Models):
- 在每個群組內,建立包含所有暴露的 Cox 模型。
- 排除未通過多重共線性檢定的暴露和在群組內模型中不顯著的暴露。
- 25 個獨立的暴露:經上述方法篩選後,保留 25 個與死亡率獨立相關的暴露。
- 不可改變的風險因子 (Non-modifiable risk factors) (2 個):
- 種族 (Ethnicity): 亞裔、非裔或其他族裔 (相較於白人)。
- 10 歲時身高 (Relative height at age 10): 相較於平均或較矮身高。
- 可改變的風險因子 (Potentially modifiable risk factors) (23 個):
- 保護效應最大 (HR < 0.8):
- 家庭收入 (Household income):越高越好。
- 就業 (Being employed):有工作較好。
- 種族 (Ethnicity):亞裔、非裔或其他族裔 (相較於白人)。
- 自我報告身體活動 (Self-reported physical activity, IPAQ):越多越好。
- 與伴侶同住 (Living with a partner):相較於獨居或與非伴侶同住。
- 危害效應最大 (HR > 1.4):
- 目前吸菸 (Current smokers)。
- 公共租賃住房 (Living in council housing):相較於自有房屋。
- 感到疲倦的頻率 (Frequency of feeling tired):越高越差。
多重共病模式與生物學機制
- 目的:探討25項獨立環境曝露與多重疾病發生模式及老化生物學機制之間的關聯,評估其在早逝路徑中的潛在催化作用。
- 方法-疾病發生率分析:利用Cox比例風險模型,分別測試每項曝露與25項老化相關疾病的關聯,追蹤期間為8至15年。
- 方法-生化標記與風險因子分析:針對每項曝露分別分析其與25項生化老化標記及三大常見疾病風險因子(高血壓、肥胖、血脂異常)的關聯性。
- 生化標記關聯結果:
- 所有25項曝露平均與22項生化標記呈顯著關聯;
- 吸菸狀態與種族與全部25項標記相關
- 睡眠時數與家庭收入與24項標記相關
- 六項曝露(包括感到缺乏熱情頻率、Townsend剝奪指數、住宅所有權、教育年數、10歲時較胖狀態及近2年內經歷經濟困難)與23項標記相關。
- 代謝風險因子關聯結果:幾乎所有曝露均與代謝性疾病風險(肥胖、高血壓及血脂異常)呈現橫斷面關聯;並且,所有曝露均與蛋白質老化呈現顯著相關。
- 疾病發生率關聯結果:
- 每項曝露平均與15項老化相關疾病發生呈現關聯;
- 吸菸(目前吸菸及吸菸包年)與21項疾病相關
- 家庭收入、Townsend剝奪指數、住宅所有權(與租屋或免租住相比)及感到疲憊頻率與19項疾病相關
- 身體活動、睡眠時數、健身及10歲時較胖狀態則與17項疾病相關
環境與遺傳的老化架構
模型構建與目的:針對年齡、性別、環境曝露 (exposome) 與基因組 (genome) 在解釋早逝及25項老化相關疾病變異的貢獻,本研究採用逐步多變量Cox模型,分別構建:
- 模型1:僅包含年齡與性別
- 模型2:在模型1上加入公開多基因風險分數 (PRS),以近似遺傳影響
- 模型3:在模型1上加入所有獨立與死亡相關的環境曝露,近似exposome
- 模型4:同時加入exposome與PRS
- 資料來源:英格蘭招募參與者 (n = 436,891),並以蘇格蘭/威爾斯 (n = 55,676) 進行驗證
模型結果—全因死亡率解釋力:
- 模型2較模型1增加R²約2–3個百分點
- 模型3較模型1增加R²約16–19個百分點
- 模型4較模型2增加R²約14–17個百分點,但相較於模型3,加入PRS僅增加不到1個百分點
- 結論:環境曝露整體效應對死亡率變異的解釋力遠超過PRS,而單一曝露效應則較小
敏感性分析—遺傳影響檢測:
- 加入APOE基因型 (rs429358與rs7412) 及FOXO3變異 (rs2802292) 後,模型2與模型4的結果幾乎無變化
- 針對25項慢性疾病死亡率進行分析,發現環境曝露 (模型3) 比包含PRS的模型 (模型2) 多解釋約14–16個百分點的變異,且於環境曝露模型中再加入PRS僅增加約1個百分點R²
模型驗證與變異解釋:
- 模型4在驗證組中對大多數結果捕捉了超過50%的變異,例外的疾病包括結腸直腸癌、胰臟癌、白血病、乳癌、卵巢癌、淋巴瘤及骨關節炎
- 根據模型4中各變數卡方 (Χ²) 貢獻比例:
- 環境暴露:對肺癌、肺氣腫/慢性阻塞性肺病(COPD)、慢性肝病和類風濕性關節炎的疾病變異解釋最多。
- 多基因風險:對乳腺癌和前列腺癌、阿茲海默症(AD)、全因癡呆、黃斑變性和結直腸癌的影響更大。
- 年齡和性別:對所有死因死亡率以及包括食道癌、缺血性心臟病和腦血管疾病在內的多種疾病影響最大,但環境暴露仍解釋了年齡和性別未解釋的大部分剩餘變異
敏感性分析—體能活動測量:
- 將基線自我報告體能活動與加速器客觀測量的體能活動進行比較,結果顯示客觀測量能多解釋約3個百分點的死亡率變異
討論
- 環境與遺傳對老化影響的首次評估:此研究首次評估環境與遺傳對老化相對貢獻,找出25個與早逝、蛋白質組學老化、老化生化標誌物和年齡相關疾病獨立相關的暴露因素。
- 主要影響因素:早逝和老化的關鍵驅動因素包括吸菸、社會經濟地位和剝奪、種族、身體活動、與伴侶同住、睡眠以及身心狀態(如疲勞),以及早期生命暴露(如10歲時的身高和體型、母親在懷孕期間的吸菸狀況)。
- 環境因素的影響:環境因素的架構由許多相互關聯的因素組成,單個因素可能只解釋早逝變異的一小部分,但綜合起來可以解釋早逝變異的很大一部分,遠超過多基因風險。
- 蛋白質組學老化特徵:暴露因素與蛋白質組學老化的共同特徵、24種主要年齡相關疾病及其代謝風險因素和多病共存有關。
- 基因組與環境暴露的貢獻度差異:不同疾病中基因組和環境暴露的貢獻差異很大。一些疾病(如乳腺癌、卵巢癌、前列腺癌、結直腸癌、阿茲海默症、全因癡呆和黃斑變性)主要受多基因風險影響,而腦血管疾病、缺血性心臟病、慢性阻塞性肺病、類風濕性關節炎和肝腎疾病則主要受年齡、性別和環境暴露影響。
- 10歲時的身高與體型:10歲時身高較矮與蛋白質組學老化減少和死亡風險降低有關,這與同物種中較小動物壽命較長的研究結果一致。10歲時體型較胖和母親在懷孕期間吸菸對成年後的蛋白質組學老化和早逝風險有影響,這支持了生命全程預防老化的觀點。
- 飲食暴露與死亡率:幾乎所有與自我報告飲食(如穀物纖維、紅肉、水果和蔬菜的攝入)和物理環境(如污染和綠地暴露)相關的暴露因素在XWAS中與死亡率有關,但與蛋白質組學老化無關。
- 可能的解釋:這些暴露因素可能是死亡的強大決定因素,但可能受到逆向因果(如人們在患病後改變飲食)或與老化無強關聯,通過其他途徑起作用。自我報告飲食暴露與蛋白質組學老化之間缺乏關聯可能反映了混雜或自我報告措施的不精確。
- 種族差異:黑人、亞洲人和其他種族的早逝風險低於白人,即使在調整了社會經濟和剝奪因素後也是如此。這與英國全國人口普查和死亡登記數據顯示的白人壽命低於其他種族的結果一致。
- 社會經濟與健康服務:這些非白人種族群體往往生活在剝奪程度更高的地區,自我評價健康狀況較差,使用健康服務的經驗也較差。需要更多研究來了解英國少數族裔儘管剝奪程度更高,但早逝風險較低的原因。
研究限制
- 因果關係未明確:儘管本研究採用前瞻性設計並仔細評估了逆向因果和混雜因素,但報告的關聯可能並非因果關係。雖然我們在不同結果(死亡率、蛋白質組學老化、血液生化生物標誌物、常見疾病風險因素和新發疾病)中觀察到一致的關聯模式,並在蘇格蘭/威爾斯招募的參與者中驗證了研究結果,但因果關係需要通過適當的研究設計來正式確立。
- UK生物資料庫人口的代表性:UK生物資料庫的人口比一般英國人口更健康、更富裕,且死亡率趨勢在死亡年齡方面也不代表一般英國人口。然而,這實際上是本研究的一個優勢,因為它使我們能夠識別與早逝相關的暴露因素。
- 暴露因素的動態變化未捕捉:由於所有暴露因素僅在整個隊列中的一個時間點測量,因此無法捕捉生命過程中的暴露動態變化。此外,由於我們僅限於此資料庫中可用的暴露因素,因此也未能捕捉所有可能的暴露影響。
- 蛋白質組學年齡時鐘的覆蓋範圍:我們的蛋白質組學年齡時鐘模型僅使用了資料庫中目前可用的約3000種蛋白質的血漿表達數據。未來基於更大蛋白質集合構建的時鐘可能提供更廣泛的年齡相關生物學變化覆蓋,可能捕捉到與其他暴露或疾病相關的生物學信息。
- 僅測試線性關聯:我們的方法的一個局限性是僅系統地測試了線性關聯。未來研究建模暴露因素的非線性關聯可能在描述暴露與健康結果之間的關係方面提供更高的精確度。
- 未測試基因-環境交互作用:我們未測試基因-環境交互作用,儘管基因和環境無疑共同影響年齡相關疾病,但這些分析容易出現假陽性結果。
- PRS對遺傳風險的低估:作為每種疾病遺傳成分的代理,PRS仍在發展中,一定程度上低估了實際的多基因風險。PRS還忽略了單個基因中的罕見變異,如BRCA1/2和阿茲海默症的類澱粉前體蛋白,因為它們的頻率較低。
- 外部驗證的困難:在鹿特丹研究中外部驗證我們的發現時,由於缺乏重疊的暴露評估,無法重複UKB中的許多發現。未來使用基於血液的暴露生物標記評估暴露因素的研究可能解決這個問題。
重點問答
Q1環境和基因哪個更重要?
A1: 這個研究主要探討環境因素 (exposome) 和基因對於人類老化和死亡的影響。研究結果顯示,環境因素對於整體死亡率的影響遠大於基因。環境因素可以解釋額外 17% 的死亡率變異,而多基因風險評分 (Polygenic Risk Scores, PRS) 僅能解釋不到 2%。
Q2: 什麼是蛋白體生物時鐘?蛋白體年齡差距又是什麼?
A2: 蛋白體生物時鐘是一種利用血液中蛋白質的表現量來預測個體生理年齡的工具。研究人員利用機器學習模型,分析了 45,441 位英國生物樣本庫參與者的血漿蛋白體數據,建立了這個時鐘。此時鐘使用了 204 種蛋白質,能準確預測個體的實際年齡 (時間年齡)。
蛋白體年齡差距 (proteomic age gap),也就是蛋白體預測年齡與實際年齡的差異,可以反映個體的老化速度。
蛋白體生物時鐘不僅能預測死亡率,還與多種常見的老年疾病 (如心臟病、肝病、腎病、肺病、糖尿病、神經退化性疾病和癌症) 的發生風險相關。
Q3: 環境因素和基因分別對哪些疾病影響比較大?
A3: 環境因素對肺部、心臟和肝臟疾病的影響大於基因
A3: 環境因素對肺部、心臟和肝臟疾病的影響大於基因
基因對阿茲海默症、乳癌、前列腺癌和大腸直腸癌的影響較大。
Q4: 研究發現了哪些重要的環境風險因子?
A4: 研究確定了 25 個與早逝、蛋白體老化標記和老年疾病相關的獨立環境暴露因子。這些因子可以分為兩類:
可改變的風險因子:吸菸,低社經地位 (例如:居住在公共住宅),缺乏運動,睡眠不足,頻繁感到疲倦
不可改變的風險因子:種族 (非白人),10 歲時的身高,母親懷孕期間吸菸
Q5: 哪些環境因素對早逝的影響最大?
負面影響:有吸菸習慣,居住在公共住宅 (相對於擁有房屋),經常感到疲倦
保護作用:家庭收入較高,有工作,非白人種族,有運動習慣,與伴侶同住 (相對於獨自生活)
Q6: 環境因子如何影響老化?與疾病和蛋白體老化標記的關聯程度有多大?
A6: 環境因素不僅影響特定疾病的發生,還會加速整體的老化過程。平均而言,每個環境暴露因子與 15 種老年疾病相關。例如,吸菸與 21 種疾病相關。家庭收入、Townsend 剝奪指數、房屋所有權和疲勞感與 19 種疾病相關。
平均而言,每個環境暴露因子與 22 種老化生物標記相關。吸菸和種族與全部 25 種生物標記相關。睡眠時間和家庭收入與 24 種生物標記相關。
個人想法
- 這項研究最大的亮點在於其採用的 Exposome-wide 分析方法。不同於傳統流行病學研究一次只關注單一或少數幾個環境暴露,這項研究系統性地評估了 UK Biobank 中 176 個初始候選環境暴露,並最終篩選出 25 個與死亡率、蛋白質體老化、多種生物標記和年齡相關疾病獨立相關的因子。
- 另一個亮點是不單單只用相關性和線性分析暴露因子和老化疾病以及早逝的相關性,還佐以和蛋白質時鐘作為生物老化指標,從分子層面驗證環境暴露與老化的關聯。
- 由於 UK Biobank 數據的限制,目前的研究未能涵蓋所有可能的環境暴露。未來的研究可以納入更多環境因素 (如飲食的精確測量、空氣污染的詳細數據、職業暴露等),更全面地評估 Exposome 的影響。
- 雖然這個研究發現了許多環境暴露與健康結果的關聯,但對其背後的生物學機制仍不清楚。需進一步探索。
- 老實說,看起來,雖然說是環境暴露因素,整體來說大部分與社經地位相關。社經地位決定了居住地,居住環境,居住方式,生活方式等等。