條文本
文摘
目的關鍵需要基於人群的前瞻性群組研究,因為他們遵循個體疾病的發作之前,允許研究可以識別生物標誌物和疾病修飾效果,從而導致係統流行病學。
參與者本文描述了設計和基線特征的集中檢查生命線隊列在荷蘭的族群。在這種獨特的subcohort,生命線深,我們包括1539名18歲以上。
發現到目前為止我們收集更多的血液(n = 1387),呼出空氣(n = 1425)和糞便樣本(n = 1248)、和引起胃腸道反應健康調查問卷(n = 1176)分析基因組、表觀基因組、轉錄組、微生物、代謝物和其他生物的水平。在這裏,我們提供了一個概述生命線的不同數據層深和現在的基線特征的研究人群包括食物攝取和生活質量。我們還描述了生命線深隊列允許基因的詳細調查,基因組和代謝變化的範圍廣泛的表型結果。最後,我們檢查腸胃健康的決定因素,一個區域可以解決我們特別感興趣的生命線。
未來的計劃我們已經建立了一個隊列的多個數據水平允許人口的綜合分析這些信息轉化為疾病的生物標記物,並將疾病預防機製提供了新的視角。
- 流行病學
- 公共衛生
- 遺傳學
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/
來自Altmetric.com的統計
本研究的優點和局限性
隊列研究的獨特之處在於,它收集了廣泛的生物材料(如,呼出的空氣和糞便)同時從禁食的人。
生命線深群體相對較小(n = 1539),然而,它將允許使用係統生物學方法概念驗證研究。
生命線深是一個“下一代”人群隊列研究多個分子數據水平與觀察性研究方法相結合。
本研究的數據將使我們能夠構建的風險概況許多常見疾病的遺傳傾向和這些配置文件鏈接到表型信息,以及臨床免疫學參數。
廣泛的問卷調查,例如,食物攝入量和醫療狀況,將提供數據正確的分子分析環境因素。
介紹
許多疾病是多因素疾病的起源,這意味著它們是由遺傳和環境組件的組合。到目前為止,相當數量的已確定的遺傳變異與幾乎所有的多因子的相關疾病或特征。1這些獨立的遺傳因素往往是常見的,在沒有疾病頻繁發生,因此還不能被用來預測疾病。例如,40個風險位點腹腔疾病,解釋大約54%的疾病風險,2但沒有明確這些風險等位基因之間的相關性和腹腔疾病。3因此,問題是:為什麼有些人發展疾病而另一些則彈性盡管攜帶許多遺傳風險等位基因?這些彈性個人不得為疾病預防提供重要線索,但他們隻能確定之後,看似健康的人。這凸顯了需要前瞻性群組研究生命過程流程調查並確定健康和疾病的決定因素。基於人群的前瞻性群組研究的一個優勢是,他們不是專門針對患病人口和他們遵循個體疾病發作之前,允許研究可以識別生物標誌物和疾病修飾效果。4此外,與年齡相關的流程與健康和疾病相關聯可以研究這些群。
生命線是165多000人的人口群體覆蓋多個參與家庭和一代又一代的重點是多因素疾病的決定因素。隊列包括詳細信息在表型和環境因素,以及健康狀況。5,6此外,遺傳信息可供約10%的人口。大約1500的一個子集生命線參與者還參加生命線深。這些參與者更徹底地檢查,特別是對分子數據,允許一個更深入的調查的遺傳和表型變異之間的關係。對於這些參與者,額外的生物材料和信息收集健康狀況。隨後,全基因組轉錄組和甲基化數據生成、代謝產物和生物標誌物是測量和評估腸道微生物組。
生命線深特別允許深入分析胃腸道(GI)與健康有關的問題,如腸易激綜合症(IBS)。這是一個重要的研究方向自胃腸道症狀非常普遍在普通人群中,有很高的對生活質量的影響。7,8腸易激綜合症是一種胃腸功能紊亂,包括腹部疼痛或不適,排便習慣的改變有關。9腸易激綜合症患病率在西方國家的不同研究之間有很大的差別,從4%上升到22%。10然而,沒有具體的測試用於診斷腸易激綜合症。目前的診斷是基於排除胃腸道疾病和症狀使用診斷標準(如羅馬III標準。9
在這裏,我們描述的研究設計和基線特征生命線深隊列和解釋如何收集到的數據可以應用於多個領域的興趣。
隊列描述
生命線
25 - 50歲的人被他們的全科醫生被邀請參與生命線的研究。在包容、參與者的家庭成員也被邀請參加為了獲得信息三代。在基線,所有參與者訪問一個生命線研究網站兩次物理考試。這些訪問之前,兩個廣泛的基線問卷在家裏完成。在第一次訪問,人體測量學、血壓、認知功能和肺功能以及其他因素測量(見在線補充表S1)。在第二次訪問,大約2周後,空腹血液樣本收集。總共167 729名參與者包括誰將隨訪30年。6每18個月,每個參與者收到後續問卷。另外,每5年一次,後續執行健康參數的測量。
生命線深
從4月到2013年8月,注冊所有的參與者在格羅寧根的生命線研究網站被邀請參與生命線深,除了常規的生命線計劃。在參與者的第二次訪問該網站,另外三管血是由一個生命線醫生的助手。呼出的空氣也收集訪問期間,參與者被指示糞便收集國內的生命線深助理。參與者同意收集糞便樣本也要求填寫問卷對胃腸道症狀。後立即收集糞便樣本,樣本是凍結在−20°C。糞便樣本收集幹冰煙霧從參與者的住所後2周內第二個網站的訪問。在到達研究地點,糞便樣本立即存放在−80°C。
生命線深研究倫理委員會批準的格羅寧根大學醫學中心。所有的參與者在入學前簽署知情同意書。
包容
最初,1539參與者包括在生命線深研究。這些參與者,78退出:51沒有完成生命線位置的第二次訪問時間和27日退出參與。總共有1461人完成了生命線深研究。從這些參與者,我們收集額外的血液遺傳學、甲基化和轉錄組分析(n = 1387);呼出空氣中揮發性有機化合物的分析(n = 1425);微生物和生物標誌物評估和糞便樣本(n = 1248;表1)。此外,返回胃腸道症狀問卷1176份。為81% (n = 1183)的參與者,我們收集了所有三個生物材料:額外的血液,呼出空氣和糞便(見在線補充圖S1)。為11.5% (n = 168)的參與者,我們收集額外的血液和呼出的空氣,和4.4% (n = 65)的參與者,我們收集呼出空氣和糞便。3.1%的參與者,我們隻有更多的血液(2.5%,n = 36)或呼出空氣(0.6%,n = 9)。
額外的數據類型
全基因組轉錄組評估作為衡量基因表達。我們從全血收集在一個孤立的RNA PAXgene管使用PAXgene血液microrna的工具包(美國加州試劑盒)。RNA樣本量化和評估完整測序。總RNA從全血剝奪球蛋白使用GLOBINclear工具包(Ambion,奧斯汀,德克薩斯州,美國),隨後處理排序使用Truseq 2圖書館準備工具包(美國加州聖地亞哥Illumina公司公司)。Paired-end測序2×50個基點是使用Illumina公司執行的Hiseq2000,池10個樣本每車道。最後,閱讀每個樣本集生成使用樹薯粉,保留隻讀取通過Illumina公司的貞潔過濾器進行進一步處理。平均生後讀取每個QC的數量是4430萬。適配器修剪後,讀取映射到人類基因組構建37使用明星(https://code.google.com/p/rna-star/)。其中,96%的讀取成功地映射到基因組。基因轉錄是量化和meta-exon級別使用BEDTools (https://code.google.com/p/bedtools/)和自定義腳本,使用FluxCapacitor轉錄水平(http://sammeth.net/confluence/display/FLUX/Home)。
我們孤立的從EDTA管和異形全基因組總DNA甲基化使用英飛納姆HumanMethylation450 BeadChip,如前所述。11簡而言之,500 ng亞硫酸氫基因組DNA的修改和用於雜交在英飛納姆HumanMethylation450 BeadChips,根據Illumina公司英高清甲基化協議。
我們確定代謝物在呼出空氣和血液。從空氣呼出代謝產物測定結合氣相色譜法和飛行時間質譜(GC-tof-MS),如前所述。12,13簡而言之,呼出的空氣樣本中引入一個GC之間的不同化合物的混合物。隨後,化合物引入女士來檢測和識別分離揮發性有機化合物。血漿代謝物的測定使用核(NMR)先生的方法,所述Kettunen等。14
基因分型的基因組DNA進行了同時使用HumanCytoSNP-12 BeadChip15ImmunoChip,定製Illumina公司英飛納姆數組。16基因分型是成功的1385個樣本(CytoSNP)和1374 (IChip)樣品,分別。首先,SNP質量控製是應用獨立的平台。snp是過濾上麵加0.001,HWE p值> 1 e−4並使用叮鈴聲呼叫率為0.98。17兩個平台的基因型對基因型存在合並成一個數據集。在這兩個平台上,基因型是穿上失蹤的non-concordant調用。合並後,snp再次過濾電話加0.05和0.98,結果在885年共有379個單核苷酸多態性的基因。接下來,這些數據是估算基於荷蘭(GoNL)的基因組參考麵板。18 - 20合並後的基因型是使用SHAPEIT2 prephased21和對齊GoNL參考麵板使用基因型使和諧協調者22為了解決鏈問題。使用IMPUTE2進行歸責23V.2.3.0 GoNL參考麵板。我們使用MOLGENIS計算24歸責管道生成腳本和監控汙名。歸責了8 606 371個變異信息得分≥0.8。此外,HLA類型建立了通過廣泛SNP2HLA歸罪管道。25
我們收集了幾種類型的細胞包括淋巴細胞和粒細胞,評估的端粒長度作為衡量老化。我們正在優化FlowFish Baerlocher端粒測量所描述的方法等。26此外,外周血單核細胞(PBMCs)收集並儲存在為未來的功能性研究−80°C。
收集糞便樣本來研究腸道微生物組。腸道微生物組成進行16 s rRNA V4可變區域的基因測序Illumina公司MiSeq平台根據製造商的規格。27閱讀質量的過濾和分類是推斷使用一個封閉的參考操作分類Unit-picking協議對preclustered綠色煤電數據庫,為實現QIIME (V.1.7.0和V.1.8.0)。28,29日此外,糞便整除存儲未來GI-health-related生物標誌物的分析。
此外,表型數據收集胃腸道健康症狀通過羅馬III標準問卷9布裏斯托爾和糞便形成規模。30.
我們收集和儲存等離子體未來的分析疾病和衰老相關循環小分子核糖核酸等生物標誌物。
分析基線特征、生活質量、胃腸道症狀和定性的食物攝入量
對於每一個參與者,心血管疾病(CVD)的風險評分計算根據評分算法開發的弗雷明漢心髒研究。31日心血管疾病風險得分範圍從≤−3≥18和計算基於性別、年齡、高密度脂蛋白、總膽固醇、血壓、吸煙狀況和患糖尿病的存在與否。
我們計算的生活質量得分基於蘭德36-item簡式健康調查得分版本我通過計算8總結成績,以及精神和身體成分的得分。32,33摘要分數範圍從0到100點,100代表了最好的生活質量。精神和身體成分分數轉換為平均50和SD 10參考人口相比,所述製品等。33,34
出現胃腸功能紊亂是評估通過羅馬III標準。9參與者與自我報告的克羅恩病,潰瘍性結腸炎和caeliac疾病被排除在分析之外。
習慣性膳食攝入量是通過收集的數據驗證食物頻率問卷由瓦赫寧根大學的人類營養分工。35
均值和SDs的基線特征和生活質量分數計算。統計項目R (V.3.0.1)和IBM SPSS統計(V.20)是用於分析和構建數據。
研究對象的基線特征
超過6個月的時間,1539名參與者參與生命線的深入研究。稍微女性比男性(n = 903, 58.7%) (n = 636, 41.3%)包括(表2)。參與者的年齡從18歲到86歲,平均年齡為44歲。平均體重指數25.2公斤/米2。平均總膽固醇水平和血糖水平都5更易/ L。女性的平均血壓降低(116/68毫米汞柱)與男性相比(124/74毫米汞柱)。在女性中,吸煙者的比例略低(18.3%)比男性(19.5%)。心血管疾病是弗雷明漢風險評分,平均而言,女性5.7和8.6對於男人來說,對應於第一心血管事件的風險為3%和7%,分別為(表2)。31日在我們的群體中,生活質量得分是最低的活力(平均(SD): 67.2(15.5))和最高的物理功能(平均(SD): 92.1 (12.3)) (圖1和在線補充表S2)。數據在年齡、BMI和血液水平參數正態分布,而心血管疾病風險評分和生命質量的數據組件偏離了常態。
分析1176年的消化係統症狀問卷確定409名參與者與胃腸功能紊亂(圖2)。腸易激綜合症患病率在我們組是21% (n = 249)。另外13% (n = 160)的參與者完成標準功能膨脹(9%,n = 108),功能性便秘(3%,n = 37)或功能性腹瀉(1%,n = 15)。三分之二的參與者(n = 767)不符合羅馬III標準胃腸功能紊亂。此外,4% (n = 51)的參與者回答說,他們從來沒有經曆任何胃腸道症狀(圖2)。
分析主要食品的攝入量組顯示的頻率細分為三個主要類別。第一類包含每日消耗的食物,例如麵包和咖啡,(圖3A、B)。第二類包含食品集團的消費範圍從每日每周幾天。這些食品集團的例子包括肉、蔬菜和水果(圖3一部)。第三類包括消耗的食物組每周每月,魚,例如(圖3F)。對於其他食物,如牛奶和酒精飲料,攝入量很大差異(圖3G H)。這些頻率數據後將結合份量和荷蘭食品成分表(2006年一舉一動,國家,比爾)估計克每天的營養攝入。
收集所有個體,額外的生物材料(見在線補充圖S1)對未來係統的流行病學研究36將多級“組學”數據與環境、物理和流行病學數據提供更深入、更詳細的視圖的生命線深人。這些生物材料包括等離子體檢查代謝物的濃度,外周血單核細胞確定全基因組轉錄和甲基化配置文件,呼出空氣分析揮發性有機化合物和糞便建立腸道微生物組成。此外,基因數據已經生成的所有個人,允許建設的各種常見疾病的遺傳風險的概要文件。這些多個數據水平將為未來的研究提供豐富的機會到人類健康和疾病的分子基礎,以及研究分子和環境之間的交互組件包括行為、社會人口因素和分析具體的子組。例如,分析微生物群的組成與老化協會透露一些類群,並強調糾正年齡在微生物研究的重要性(圖4)。
發現到目前為止
特別感興趣的一個領域是胃腸道的健康相關的領域。因此,我們研究了腸易激綜合症的患病率在生命線深。我們確定了IBS在21%的參與者。解釋這些數據應謹慎,因為我們的診斷是完全基於參與者的反應羅馬III標準問卷,因此結果可能有點誇大了。然而,我們的結果與先前的建議是一致的,幾乎25%的人口接觸腸易激症狀在一生。37其患病率在我們群證實腸易激綜合症是一種常見的疾病,因此研究旨在改進診斷和治療將造福社會。消化係統症狀是多因素疾病,使大軍團需要更詳細地研究它們。腸易激綜合症,特別是,迫切需要開發預測疾病的生物標記物。我們選擇了6個GI-health-related生物標誌物和開發出一種多疇的生物標誌物麵板,可以區分IBS患者和健康對照組,在IBS患者胃腸道症狀嚴重程度相關(2015年Mujagic Z,投稿)。生物標誌物麵板是在馬斯特裏赫特IBS組開發的(目前包括400例和200名健康對照組,招聘正在進行)和驗證的生命線深隊列。此外,我們研究了揮發性有機化合物(VOC)概要文件從空氣呼出組和對照組相比IBS患者(Baranska 2015,投稿)。我們發現了一個新的呼吸生物標誌物的16個揮發性有機化合物的儀器,區分腸易激綜合症患者與健康對照組和消化係統症狀的存在顯著相關。此外,我們合作一項大型的全基因組關聯研究在IBS的遺傳結構的識別。38幾個染色體區域的暗示意義被確定在單獨的軍團。綜合分析這些數據目前正在進行。此外,我們正在分析食物攝入量IBS患者和健康對照組。
盡管腸易激綜合症的患病率高,生活質量在我們的研究人群一般高於隨機選擇的荷蘭人口Aaronson報道等。39這可能是由於年齡和性別差異,自全國樣本中56%的男性平均年齡(SD) 47.6(18)年,3941%的男性平均44.6(13.8)歲(SD)的生命線深隊列。世俗的變化也可能扮演一個角色,因為全國調查超過15年前。
生命線深也是一個獨特的、獨立的數據源。大概1500人,我們將能夠構造傾向許多常見疾病的遺傳風險概要文件基於全基因組關聯數據。接下來,我們將能夠鏈接這些表型信息的風險概況,以及臨床免疫和其他參數。利用這些信息,我們可能已經能夠比較高危患者和沒有疾病症狀產生假設彈性個體。最近,Ricano-Ponce等14免疫介導性疾病的遺傳學研究和確定單核苷酸多態性(snp)明確影響長非編碼rna的表達在這些疾病(Ricano-Ponce我2015,投稿)。同時,生命線深還允許集成不同的數據來研究水平,例如,分子和表型數據之間的關係來增加我們對致病機製的理解。40例如,在從生命線深隊列分析數據,我們發現關聯的細菌分類年齡(圖4),身體質量指數和血脂水平(2015年傅J出版社循環研究)。此外,Smolinska等進行廣泛分析混雜因素如吸煙和BMI在揮發性有機化合物的儀器分析(Smolinska 2015,手稿在準備)。
優勢和局限性
人群隊列研究設計中,重要的是要平衡寬度(包括樣品的數量)和深度(表型數據的數量)。生命線是一個大型的前瞻性群組,其中包括165多000人和措施幾千表型從生化參數、物理測量、心理特征和環境因素,對健康狀況的詳細信息。然而,隊列不設置包括分子數據水平在人類健康和疾病的研究。與生命線深,我們執行一個試點研究額外的深度測量分子1500人,使用生物材料從不同的領域都收集了禁食的同時個人。雖然生命線深群體相對較小,它將使流行病學概念驗證研究係統。生命線深的獨特之處在於,它呼出空氣測量所有個人和一個級別的信息,據我們所知,很少出現在其他人群為基礎的群組。此外,收集細胞端粒長度測量,進一步功能研究和糞便樣本集合,是獨一無二的。生命線深不僅有助於更好地理解遺傳變異和分子之間的關係函數,但也可以結合其他人口群體,也有類似的分子數據。特別是,糞便材料的收集和分析是至關重要的考慮到越來越多的證據表明,腸道微生物可以在健康和疾病起著重要的作用。41然而,協調和連接的數據跨多個軍團可能需要實現關鍵數字。生物和生物分子研究基礎設施在荷蘭(BBMRI-NL)42和歐洲43對此類研究將允許。生命線深設計詳細研究風險敞口而疾病異質性數據是有限的。結合我們與特定疾病和tissue-specific-data-collection exposure-driven-data-collection隊列人群,如荷蘭癌症隊列研究,可以提供更多的洞察疾病機製。44,45
協作
我們已經建立了一個隊列的多個數據層允許綜合分析這些信息轉化為生物標誌物的人群的疾病和疾病機製和預防提供新的見解。我們鼓勵與其他群組研究人員的合作與樣本量增加上述方麵。生命線深隊列的數據可以通過生命線。6研究人員可以申請數據和生物材料提交建議由生命線研究辦公室(LLscience@umcg.nl)。測量變量的詳細信息可以在網上找到生命線數據目錄(http://www.lifelines.net)。所有建議將回顧科學質量生命線和方法論的科學。
確認
作者要感謝生命線的生命線參與者和員工學習網站,格羅寧根,協作。作者還要感謝生命線深研究助理,威爾瑪Westerhuis-van der Tuuk, Marc Jan焊機阿斯特麗德Maatman,馬修Platteel,金正日德蘭格和黛比·範·Dussen實用和分析工作。作者感謝成龍和凱特·麥金太爾高級編輯我們的手稿。此外,作者要感謝目標項目(http://www.rug.nl/target)提供計算機基礎設施和BigGrid / eBioGrid項目(http://www.ebiogrid.nl)讚助歸罪管道實現。
引用
腳注
貢獻者連續波,低頻,JAMD, rp和AZ參與的概念和設計研究。EFT JAMD, GH, AB, ZM評選,MAS, PD, MCC黨衛軍導致發展方法和數據收集。EFT,阿茲,一個mm和EJMF參與數據分析和解釋。EFT和深圳起草工作。本文作者所批判修訂和批準最終的版本出版。
資金這個項目是由一個頂級研究所食品和營養瓦赫寧根格蘭特GH001 CW,荷蘭生物和生物分子研究基礎設施(BBMRI-NL)授予RP3低頻和倫理委員會先進格蘭特ERC CW - 671274。深圳擁有羅莎琳德富蘭克林獎學金(格羅寧根大學)。MCC博士後獎學金從西班牙Fundacion阿方索馬丁Escudero。
相互競爭的利益沒有宣布。
倫理批準生命線深研究倫理委員會批準的格羅寧根大學醫學中心的文檔數量METC UMCG LLDEEP: M12.113965。所有參與者簽署知情同意書之前報名學習。
出處和同行評議不是委托;外部同行評議。
數據共享聲明研究人員可以申請數據和生物材料提交建議由生命線研究辦公室(LLscience@umcg.nl)。生命線網站提供信息在應用程序進程(http://www.lifelines.net)。