條文本
文摘
目的哥本哈根的目標醫院Biobank-Cardiovascular疾病組(CHB-CVDC)是建立一個群組,可以加快我們對心血管疾病的發生和發展的理解共同學習遺傳學,診斷,治療和危險因素。
參與者CHB-CVDC是大基因組的心血管疾病患者。CHB-CVDC目前包括96 308例。慢性乙肝的隊列是發起於2009年在丹麥的首都地區。慢性乙肝不斷增長40 ~ 000樣本/年。在慢性乙肝患者中包括CHB-CVDC如果他們18歲以上和指定至少一個心血管診斷。此外,達到110 000獻血者可以與CHB-CVDC共同分析。連杆與丹麥國家衛生注冊、患者電子病曆和臨床質量數據庫允許達到41年的病史。所有個人使用英全球篩選數組Illumina公司基因分型和估算使用引用麵板組成的全基因組序列數據從8429年丹麥人連同7146年歐洲西北部的樣本。目前,39 539患者死亡。
發現到目前為止這裏,我們展示的效用隊列通過展示心血管病已知的變異和選擇之間的整合效果,也就是說,> 93%的一致性對冠狀動脈疾病,心房纖維性顫動、心髒衰竭和膽固醇測量和一致性為85%高血壓。此外,我們評估多個研究設計和使用的有效性丹麥獻血者CHB-CVDC的一部分。最後,CHB-CVDC已經為病竇綜合征的研究作出了重大貢獻和植物甾醇的角色在動脈粥樣硬化的發展。
未來的計劃除了遺傳之外,患者電子病曆,國家社會經濟和衛生注冊CHB-CVDC廣泛描述每個病人,為改進提供了一個有前途的框架對風險的理解和保護變體。我們的目標是包括其他可測量的生物標記物例如,蛋白質CHB-CVDC multiomics心血管研究平台。
- 遺傳學
- 心髒病學
- 流行病學
數據可用性聲明
合理的請求數據。這項研究將堅持公平(http://datafairport.org/:可發現的,訪問,可互操作和可重用)的概念。為進一步訪問可能性和聯係方式請參見:https://www.regionh.dk/blodbanken/afdelingen/enheder-paa-rigshospitalet/Sider/biobank.aspx。數據依照“丹麥後作用於數據保護監管歐盟(EU) 2016/679, 2016年4月27日pf歐洲議會和理事會的保護自然人的個人數據的處理和等自由流動的數據,和廢除95/46 / EC號指令”。所有數據都存儲在一個私人安全雲Sciences-Computerome丹麥國家超級計算機的生活。
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
來自Altmetric.com的統計
本研究的優點和局限性
基因數據96年308例允許廣泛的研究常見和罕見的心血管疾病。
廣泛的病史信息允許高水平的粒度分層,可以結合社會人口和其他環境因素。
有一個潛在的偏見造成的選擇丹麥的健康獻血者獻血研究控製的病例對照研究。
介紹
心血管疾病(心血管病)包括心髒和大血管和疾病的範圍從無症狀疾病實體到心肌梗死,心力衰竭(HF)、心髒性猝死和中風。可改變的危險因素,如肥胖、吸煙、高血壓和dyslipidaemia共享跨多個心血管病。跨幾個心血管病遺傳風險因子也共享,例如,最早的和最可靠的遺傳標記對冠狀動脈疾病(CAD),染色體9 p21軌跡,也與中風、動脈瘤和心肌梗塞。1 - 4遺傳CAD的研究開始聯係研究,確定單基因CAD和小的原因與可疑的候選基因研究的發現。這個領域已經進化出增加軍團和大,心電圖等國際財團和CAD C4D遺傳學協會的成立。5 - 8這些舉措結合個人努力跨多個血統導致171個全基因組重要CAD風險變異的發現,912個高頻變異10和至少138心房纖顫(房顫)位點,11已複製到獨立的種群。預計還有更多風險變異被發現。英國生物庫等生物銀行,最近日本生物、FinnGen和Trøndelag健康研究(亨特研究)12 - 15了遺傳研究和民族多樣性增加了參與者和表型等大規模的基因研究在心血管病研究。不僅數量增加,但詳細信息捕獲使更深層次的生物的表現型參與者個體與巨大的潛力為精密心髒病鋪平了道路。改善我們的理解複雜的基因之間的相互作用,生活方式的因素和個體心血管病需要大軍團,如哥本哈根醫院生物(慢性乙肝)心血管疾病組(腦血管病),使分層的個人更精確和詳細的表型。
這裏,我們現在CHB-CVDC,一個強有力的資源在心血管病遺傳研究。CHB-CVDC是慢性乙肝的一部分,2009年發起,由美國臨床免疫學,丹麥哥本哈根大學醫院。慢乙肝利用既存血液銀行係統,除了治療義務(如輸血)旨在支持醫學研究。慢性乙肝的數據基礎是剩下的EDTA的集合住院病人的血液樣本在丹麥的首都地區,受到血型檢定或紅細胞抗體篩查。詳細信息數據收集、質量評估和存儲可以在Sørensen找到等。16目前,慢性乙肝包含樣本超過450 000人。16每個病人標識由中央人注冊(CPR)數量,促進連鎖全國注冊和患者電子病曆。全國注冊中心和患者電子病曆不斷更新。在慢性乙肝患者在18歲和隻包含一次。16
CHB-CVDC的目的是提供一個平台為研究遺傳、環境、醫療和其他因素進一步我們的知識開始,進展和心血管病的表現。CHB-CVDC促進個體疾病的研究以及共享風險因素,病理生理學和疾病軌跡。慢性乙肝的樣品鏈接到個人數據的能力可以從當地醫院數據庫,丹麥國家衛生注冊、患者電子病曆和臨床質量數據庫在丹麥促進細粒度分層的患者亞種群。此信息可以用於開發為例,CAD和其他心血管病的危險預測模型。
本研究的目標是提出CHB-CVDC的特點和評估使用群組作為基因研究的資源通過複製建立基因變異與CAD、房顫、高頻、原發性高血壓和膽固醇水平在歐洲的人口。此外,我們也調查的潛在偏差包括丹麥獻血者人群。
隊列描述
人口特征
慢性乙肝是hospital-driven生物擁有廣泛收集計劃覆蓋範圍廣泛的疾病,旨在促進健康和疾病的研究,使研究人員訪問大型資源定義良好的患者樣本。16的CHB-CVDC入選標準包含兩個組件:個人(1)包括在慢性乙肝,(2)被指派至少一個住院的代碼了表1。更詳細的人口特征的概述,請參閱在線補充表1。隻有第一個分配CVD數。目前,CHB-CVDC包括96 308人(55%的男性),和群體增加病人被包括在連續的基礎上。
雌性老當確診為他們的第一個化學汽相澱積(63.2年,95%可信區間63.1到63.4)與男性相比(59.8年,95%可信區間59.7到60.0)。
我們評估並發症的患病率CHB-CVDC使用Charlson發病率指數。17 18看到在線補充材料對於一個完整的描述。我們發現34 375人(男性53%)至少有一個疾病,和23 656人(61%的男性)有超過五個並發症(在線補充表2)。在線補充圖1概述並發症的數量在不同的年齡群體。因此,隊列是驅動的上下文中研究心血管病並發症。概述診斷分配之前第一心血管疾病提出了在線補充表3。群內的同現的心血管病也明顯,明白了在線補充表4概述。
最普遍的疾病是高血壓,64 455 CHB-CVDC患者的影響。交叉引用和丹麥國家處方注冊,63年431例救贖一個或多個處方抗高血壓藥物。此外,26 581人被診斷出患有血膽甾醇過多(在線補充表5)。
二進製疾病特征的研究中也有機會使用來自丹麥的獻血者獻血研究(dbd), 110 000人添加到隊列總人口308 (n = 206)。dbd是一個大型的前瞻性研究的獻血者招募從血液銀行基礎設施在丹麥。19社會人口丹麥獻血者的細節,包括性別和年齡分布、教育、勞動力市場背景和城市化水平可以在b .找到等。19dbd的一部分,dbd基因組群後來成立的目的是識別基因預測重要的健康的捐贈者表型。20.基因分型和歸責在dbd的樣本進行樣本的一樣。20.
後續
96 308個人組目前在隨後的CHB-CVDC正在通過丹麥國家注冊,包含詳細的縱向信息在每一個接觸丹麥初級和二級保健服務。我們將定期更新的數據收集從許多注冊表中提取信息來增強基於注冊表現型的隊列。鏈接注冊中心不斷地更新和到目前為止仍然活著的隊列包含56 769例和539年39歲死於每來自丹麥的信息注冊表的死因。21從夾雜物的平均時間(2009年之後)隨訪結束(2020年以前)或死亡是3.9年(差1.70 - -5.73)(在線補充圖2)。然而,由於表型數據還包括包含之前,平均隨訪時間是41年。這對應的大多數病人一直以來一直遵循《盜夢空間》在1977年丹麥國家病人的注冊表。
最常見的死亡的根本原因是癌症(36%),其次是心髒病(17%)和呼吸係統疾病(10%)。然而,隻有2.6% (n = 969)的那些死於醫療原因進行了解剖和確切的原因因此受到相當大的不確定性。21日22在那些經曆解剖心血管疾病是最常見的死因(52%)。在線補充表6總結了所有患者的死亡原因在CHB-CVDC去世。
病人和公眾參與
病人和公眾沒有參與這項研究的設計。
遺傳學
作為合作的一部分,哥本哈根大學醫院,Rigshospitalet,丹麥和解碼遺傳學、冰島、剩下的EDTA CHB-CVDC的患者的血液樣本送到解碼遺傳學進行DNA提取、pcr和隨後的汙名。SNP基因分型結果進行全球英飛納姆從Illumina公司篩選數組。大約有660 000個常見變異基因分型。參考小組骨幹組成的全基因組序列數據從8429年丹麥人連同7146年樣本西北歐從各研究項目參與者解碼遺傳學用於汙名。第23 - 25基因分型的樣本的分階段使用長程Eagle2連同171 298西北歐的基因樣本。全基因組序列的過程參考小組骨幹,和隨後的歸責廣泛前麵描述的。第23 - 25基因分型和歸責過程是相同的一般程序應用於dbd和詳細描述。20.
數據庫
丹麥有一個世界上最全麵的人口登記係統,集成通過社會安全號碼(CPR)成立於1968年。26全國個體層麵的數據通過心肺複蘇可鏈接數量包括生日、居住地,移民,移民、家庭關係、教育、勞動力市場的聯係,導致死亡和日期,更使深CHB-CVDC表現型的患者。26 - 30日丹麥國家住院病人注冊中心包含所有的信息,自1977年以來。這個注冊表包括住院日期、診斷相關住院,醫院檢查和程序。31日在這個注冊表進行分類診斷根據國際疾病分類,V.8(1977 - 1993)和版本10 (1994 -)。32程序代碼使用直到1995年國家編碼進行分類,然後根據北歐Medico-Statistical委員會手術分類。33
此外,患者電子病曆,包含臨床指出,實驗室結果、圖像和治療是可用的。從臨床指出我們在提取的過程中吸煙、飲酒、身高、體重和血壓測量使用文本挖掘方法。電子健康記錄覆蓋所有醫院新西蘭首都地區和地區在2006 - 2016年期間,和87%的患者在CHB-CVDC數據相關的至少一個住院。
實驗室數據庫包含部門的實驗室結果臨床生物化學和臨床免疫學實驗室在丹麥。這個數據庫包括結果住院,門診和緊急會麵。數據庫包括數據可以追溯到2008年。我們正在使來自不同實驗室的數據具有可比性。
丹麥國家處方在丹麥注冊表包含所有處方藥分發數據自1995年以來,這是由法律強製所有藥店報告這個注冊表。34因此,可以跟蹤藥物使用和遵從性,評估藥物和paraclinical結果之間的聯係,通過完善的藥物相關表型研究疾病,不需要住院治療,如高血壓和糖尿病。34結合患者電子病曆,住院期間藥物管理該數據庫是一個有價值的來源藥物基因組學研究,從那裏我們可以提取信息藥物劑量/管理規定,劑量變化和依從性隨著時間的推移,不良反應和複方用藥。35
丹麥醫療係統已經開發了一些國家臨床注冊如丹麥心注冊表,房顫數據庫,數據庫家族血膽甾醇過多和丹麥心力衰竭數據庫。36 37這些數據庫提供的信息如身體質量指數、吸煙、飲酒、糖尿病史,以前的心髒手術,隨訪和結果數據和其他相關變量。36 37注冊表和數據庫的一個廣泛的概述和其內容在線補充表7。
發現到目前為止
驗證CHB-CVDC作為遺傳資源的研究,我們複製的遺傳變異與CAD、房顫、高頻、原發性高血壓和膽固醇水平確定在先前的大薈萃分析多個種群。
對於每一個表型,我們選擇研究基於出版日期的引用,個體的數量遺傳分析和基因血統的人(尤其是歐洲)(表2)。獨立的重要遺傳變異從參考檢索研究並與協會CHB-CVDC結果。廣義線性混合模型(可伸縮的、準確的實現廣義混合模型,SAIGE)和線性混合模型(貝葉斯混合模型關聯方法,BOLT-LMM)應用於獲得協會結果包括遺傳變異。38 39CAD、房顫、心力衰竭和高血壓,我們用例和控製從包含CHB-CVDC和dbd的隊列。此外,我們比較對照組的選擇如何影響這些發現,(1)隻使用從CHB-CVDC病人病例或控件(2)隻使用來自dbd CHB-CVDC和隻能控製。更多細節中可用的方法在線補充材料。
膽固醇測量
病人首先測量水平的高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、總膽固醇(TC)和甘油三酯(TG)提取基於轉碼從實驗室數據庫在丹麥。詳細信息中發現的方法在線補充材料。超過80 000對應於83%以上的CHB-CVDC至少有一個膽固醇測量。我們觀察到,TG的影響大小在很大程度上整合與之前相比研究(圖1 g和在線補充表8)。高密度脂蛋白、低密度脂蛋白和TC研究中的尺度效應較低而參考的尺度效應研究(在線補充表8和圖1 d-f)。複製變異的比例相比,我們有能力複製數量超過85%的膽固醇分析。高密度脂蛋白協會分析,分析與大多數複製變異(81%)。
原發性高血壓
高血壓病例使用icd - / ICD-8代碼和處方抗高血壓藥物。這與參考研究,直接測量收縮壓和舒張壓。40觀察到的效應大小和參考的尺度效應研究呈正相關,雖然小比例的變異整合方向的影響(85%)相比,上述表型(> 90%)(圖1 h,我和表2)。變異的數量我們有能力複製很低(59/258和80/307)和複製變異的比例與變異的數量我們有能力複製也低(< 67%)。
額外的比較與參考研究
變體都出現了類似的等位基因頻率的頻率參考研究(在線補充圖3)。總的來說,參考研究協會p值較低,可能是因為更大的樣本大小(在線補充圖4)。的變異,顯示不和諧的方向影響小尺度效應和大型se。
我們能夠複製> 85%的九個表型的變異,考慮到估計的力量(權力= 0.8,α= 0.05)(表2)。
比較不同的研究設計
我們重複協會分析CAD、房顫和高頻隻有病人從CHB-CVDC控製,隻有參與者dbd的控製,分別。所有表型對照組沒有影響變異的數量與整合的方向效應,但複製數量變異減少當隻有dbd被用作控製(在線補充表9和在線補充數據5 - 8)。此外,我們采用LD得分回歸探討殘餘混雜(在線補充表10)。41殘餘混雜通過LD評估得分回歸攔截和衰減率(攔截和χ均值之間的比率2統計)。一個攔截接近表明你沒有額外的混淆,和一個小的比率顯示,基因表型的通脹來自polygenicity殘餘混雜而不是。最後,我們也評估了遺傳相關性使用LD得分回歸之前的研究(在線補充表11)。我們用1000歐元v3 LD基因組參考麵板的分析。隻使用dbd控製取得了高水平的殘餘混雜。遺傳相關分析顯示設置隻使用CHB-CVDC沒有明顯不同於主要的分析。我們不能計算基因相關性過去研究設計觀察到的遺傳是負麵的。
其他貢獻
在最近的一項研究中,樣本CHB-CVDC一起使用了冰島的英國生物庫的樣本和樣本,檢查ABCG5/8變異的影響膳食膽固醇和植物甾醇和CAD的風險。42作者得出結論,植物甾醇可能參與動脈粥樣硬化的發展和臨床試驗需要調查是否植物固醇增加心血管疾病的風險。42 43
全基因組關聯研究病竇綜合征469例和一百萬多個控件顯示6個位點相關疾病。44孟德爾隨機顯示房顫的直接作用,降低心率病竇綜合征的發展。44
血管性水腫是一種已知的藥物不良反應與抗高血壓血管緊張素轉換酶抑製劑治療的個體。丹麥的一項研究發現常見變異靠近血管舒緩激肽受體B2基因與增加患血管性水腫相關的風險與血管緊張素轉換酶抑製劑治療。45
討論
在這項研究中,我們報告的特點CHB-CVDC並使用基因數據驗證基於注冊CHB-CVDC表現型。我們展示一個高比例的變體之間的整合效應的方向各自的參考研究和當前的研究。CAD、房顫、高頻和膽固醇測量比例超過93%。高血壓的診斷與血壓測量變異的比例相同的方向降低,但仍為85%。
為房顫複製變異的比例超過60%,高頻和膽固醇測量相比,我們有能力複製數量。對CAD和高血壓,這比例< 67%。較低的比例會導致不同的表現型,分析方法、人口差異和病例數與參考研究中樣本的數量。CHB-CVDC此外,很大比例的患者有高血壓的診斷,因此它幾乎是唯一可以與dbd這是一群年輕和健康的個體通常(見下麵的文本)。
很可能有係統性血壓測量用於本研究將增加的一致性研究我們複製。不過,我們表明,該代理使用的血壓,診斷代碼高血壓和抗高血壓藥物的處方捕獲足夠的信號最強的信號複製一些類似的效應大小。我們目前在提取的過程中血壓測量的非結構化臨床使用文本挖掘方法,指出,他們將在未來的研究。
分析與dbd控製,表明此設置減少複製數量變異和殘餘混雜高。房顫和高頻dbd似乎與病人一起從CHB-CVDC控件和CHB-CVDC控件可以交替使用。然而,仔細研究設計的考慮是必要的,取決於表型在調查之中。在這裏,我們列出了這樣做的一種方式。
房顫、高頻和膽固醇測量複製變異的比例相比,我們有能力複製數量> 85%。總的來說,這些結果承諾關於未來合作與CHB-CVDC發現或複製隊列。
年齡的比較心血管診斷和年齡血型檢定測試表明,絕大多數的病人已經有心血管診斷時加入該群。這樣的研究設計,包括前的事件發生可能導致幸存者偏見,人死於疾病包含不屬於前的分析。盡管如此,隨著世代的增加的規模隨著時間的推移,這種潛在的問題將會消失。
優勢和局限性
作為hospital-driven生物與全麵收集計劃,慢性乙肝涵蓋範圍廣泛的疾病,從而促進臨床重要性高的大規模研究在許多患者團體包括CHB-CVDC心血管病的患者。常規血液樣本的收集診所是一個有效的生物實踐,以及用於表現型的數據已經可以通過注冊的時間和成本的研究利用生物平台如CHB-CVDC小於使用主數據收集研究。
基因96 308名患者的數據,CHB-CVDC包括數量的顯著增加心血管患者的基因數據。10 11 40 46這是一個力量的新發現的遺傳和環境危險因素和相互作用以及與其他軍團的主要力量合作增加未來的meta分析的力量。
潛在的基因數據鏈接到個人層麵數據從丹麥國家注冊在流行病學和遺傳研究是一個巨大的優勢。丹麥有一個世界上最古老的注冊表信息的係統全國住院治療上從丹麥國家病人注冊表加上丹麥民事登記係統。26日31日因此,類似於其他北歐國家,丹麥是一個先進的數字化臨床係統質量和研究目的。由於這些注冊中心是全國醫療保健係統是由國家稅收在丹麥,以人群為基礎的高覆蓋率。長期時間所有住院登記、過程和治療還支持的研究軌跡不同的疾病及其時序關係。31日
在過去的幾十年裏,許多臨床質量數據庫創建與心血管相關研究,例如,Karbase,全國血管手術的數據庫從1993年起,丹麥的心注冊表信息的CAD患者冠狀動脈造影,經皮冠狀動脈介入或冠狀動脈旁路移植於2004年。36個47因此,我們將能夠分層患者在一個高水平的細節結合社會人口和其他環境因素。
CHB-CVDC堪比其他主要hospital-driven軍團,病人不是招募基於一個特定的疾病。然而,當患者接受血液輸入或紅細胞抗體篩查患者的健康狀況可能比在其他hospital-driven軍團。
一個挑戰在設計全基因組關聯研究在CHB-CVDC選擇控件。有一個潛在的偏見造成的選擇dbd獻血者的控製。與病人CHB-CVDC dbd的參與者更年輕。19這是不可避免的,這些參與者在未來將開發心血管病。此外,隱式dbd的參與者比一般人更健康,從而也從CHB-CVDC比病人更健康。19 48這是我們發現隻使用dbd以控製複製變異的數量減少,和殘餘混雜高。如何克服這些挑戰在將來的研究中必須考慮和反映在研究設計。
數據可用性聲明
合理的請求數據。這項研究將堅持公平(http://datafairport.org/:可發現的,訪問,可互操作和可重用)的概念。為進一步訪問可能性和聯係方式請參見:https://www.regionh.dk/blodbanken/afdelingen/enheder-paa-rigshospitalet/Sider/biobank.aspx。數據依照“丹麥後作用於數據保護監管歐盟(EU) 2016/679, 2016年4月27日pf歐洲議會和理事會的保護自然人的個人數據的處理和等自由流動的數據,和廢除95/46 / EC號指令”。所有數據都存儲在一個私人安全雲Sciences-Computerome丹麥國家超級計算機的生活。
倫理語句
病人同意出版
確認
我們要感謝病人在dbd CHB-CVDC和參與者。我們感謝解碼遺傳學/安進和臨床免疫學、哥本哈根大學醫院對金融支持本研究。此外,我們感謝工作人員在生物設施和醫院的工作使這個群體的存在可持續。
引用
補充材料
-
補充數據
僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。
腳注
推特@Karina_Banasik、@fhq750 @s_brunak @MetteNyegaard
合作者我們鼓勵科學合作基於CHB-CVDC中生成的數據和彙總發布的統計數據分析將根據要求提供。任何合作需要首先CHB-CVDC指導委員會批準。
貢獻者IHL KB, HH和胡錦濤的構思和計劃的實驗。IHL進行了分析。KB, HB,某人,RF-S、HH,路,CT-P,地麵讀數,CE、錳、HS, UT, DG, OBP, KS和胡錦濤導致群體和研究設計。KB, DW, LT、MAHL女士,ES,胡錦濤和某人建立了數據基礎設施和數據治理設計。HB、RF-S,路,CT-P OBP, HS, AG)、FZ, GBW, AO, GÞ,通用和胡是數據捕獲工具。IHL KB, ADH、OP PCH和DW導致了結果的分析和解釋。IHL、KB和胡寫手稿。胡錦濤是這項工作的擔保人。所有作者提供了重要的反饋,幫助形狀分析和手稿,並批準了最終版本。
資金這項工作是由諾和諾德基金會(NNF)(格蘭特數字:NNF17OC0027594, NNF14CC0001和NNF18SA0034956),創新基金丹麥(格蘭特號碼:5153 - 00002 - b)和Nordforsk精密醫學心(格蘭特數量:90580點的心)。
相互競爭的利益作者隸屬於解碼遺傳學/安進受雇於這家公司。
出處和同行評議不是委托;外部同行評議。
補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。