條文本
摘要
目的建立一個能夠識別影響人類健康的基因組因素的隊列,並增強獻血者健康和安全輸血的能力。人類健康是複雜的,涉及幾個因素,其中一個主要因素是基因組方麵。基因組時代導致了許多包含大樣本的財團,這已被證明成功地識別了與特定性狀相關的遺傳因素。然而,建立大規模的隊列研究,促進遺傳因素、環境因素和生活方式因素之間的相互作用,因為這些因素在生命過程中發生變化,這仍然是一個巨大的挑戰。這種努力的一個主要障礙是很難重新訪問參與者以檢索額外的信息並獲得縱向、連續的測量。
參與者獻血者(n=11萬)已同意參加丹麥獻血者研究。這項研究使用了丹麥血庫的基礎設施。
迄今為止的發現該隊列包括廣泛的表型數據和全基因組基因分型數據。此外,有可能從國家登記處以及將來訪問時從捐贈者處檢索額外的表型數據,包括連續測量。
未來的計劃提供影響我們健康因素的新知識,從而為研究基因組因素對人類健康的影響,特別是環境因素與遺傳因素之間的相互作用提供平台。
- 遺傳學
- 預防醫學
- 公共衛生
這是一篇開放獲取的文章,根據創作共用署名非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此基礎上進行構建,並以不同的條款許可其衍生作品,前提是正確引用原始作品,給予適當的榮譽,任何更改都已注明,並且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/.
數據來自Altmetric.com
本研究的優勢和局限性
隊列設計允許結果測量。
持續重新評估疾病狀態。
隊列由精選的獻血者組成。
簡介
一個人的健康是由遺傳、環境和生活方式因素之間複雜的相互作用決定的。對這些因素進行集體和前瞻性的分析是可取的。然而,這通常隻可能使用出生隊列和基於人口的大型隊列,由於建立此類隊列涉及大量工作,因此很少。丹麥獻血研究(DBDS;Dbds.dk)是一個大型前瞻性獻血者隊列,旨在確定健康獻血者的預測因素。作為該隊列的一部分,我們現在已經建立了DBDS基因組隊列,評估11萬名捐贈者的常見單核苷酸多態性(SNPs)。因此,DBDS基因組隊列提供了與影響捐贈者健康的眾多環境和生活方式因素相關的大規模遺傳分析的全麵目錄。對表型和數據覆蓋的概要統計的描述表1.在Burgdorf可以找到丹麥獻血者的詳細社會人口學描述,包括性別和年齡分布、種族、教育、就業和城市化水平等(2017)。1
對獻血者健康狀況的評估之所以重要,有以下幾個原因。對獻血者和受血者來說,保持健康的獻血者群體、高獻血率和低退出率至關重要,從而確保穩定的血液供應。需要為招募、護理和保留獻血者提供循證指南,以確保招募獻血者的重點是有可能保持健康並長期頻繁捐贈的個人。一個明顯的相關影響參數與鐵代謝有關:我們知道數百個基因影響血細胞的產生和調節2並影響鐵吸收和代謝的表型變異。3 - 5全基因組SNP信息有望提供知識,使我們能夠評估向誰獻血是沒有問題的,從而有助於保持穩定的獻血者群體。另一個參數是利他主義。利他主義作為親社會行為的一部分,無私地關心他人的福利,6通常被認為是典型的獻血者特征。7然而,自願獻血背景下的利他主義也被證明是一種非常複雜的表型。7在之前的一項研究中,我們發現,與之前大多數關於利他主義的雙胞胎研究相比,基因對獻血者行為的影響要大得多,這進一步強調了獻血者性格的異質性。8隊列中相當數量的親屬關係(雙胞胎和兄弟姐妹)與來自丹麥登記的社會經濟變量相結合,將使我們能夠進一步區分遺傳影響和獻血利他主義的社會基礎。全基因組SNP信息將提供知識,可以幫助識別長期和穩定的捐贈者。此外,我們將測試基因型SNP信息與軀體和精神疾病或疾病的前驅症狀之間的關聯。
DBDS基因組隊列提供了評估異質暴露對廣泛表型的影響的可能性,如精神狀態、冒險行為和血液成分和免疫防禦的特征。該研究的設置允許研究人員評估(1)橫斷麵研究中的遺傳關聯,即表型特征、臨床和生化測量的變化,(2)回顧性研究,例如康複能力,以及(3)前瞻性研究,例如,分析隨著時間的推移,表型和臨床測量的變化,甚至確定前驅症狀。
隊列描述
人口
丹麥全國的獻血者人口超過23萬,每年獻血超過30萬次(http://www.bloddonor.dk).在丹麥,獻血是自願的,而且是無償的。這意味著捐贈是基於幫助那些需要它的人的願望,而不是經濟利益的願望。獻血者必須身體健康,年齡在17歲和67歲之間,體重在50公斤以上。長期接受治療的個人或經常前往血液病高發國家的旅行者不得參加。延遲規則可以在http://www.bloddonor.dk.來自外國的獻血者必須在丹麥居住至少1年,有丹麥社會安全號碼,並學會丹麥語,以防止獻血者和血庫專業人員之間產生誤解。
丹麥全國血庫是由地方和國家稅收資助的丹麥醫療保健係統的組成部分。丹麥醫療保健係統由國家機構、地區和市政當局民主選舉產生的議會管理。丹麥血庫是由丹麥五個地區各自擁有和經營的非營利組織。血庫有一個全國委員會,負責跨地區合作招募獻血者,為丹麥人民處理和分發血液。DBDS以丹麥結構化血庫係統為基礎,負責管理27家醫院的捐獻點,此外還有5個流動捐獻單位,使用全國180個選定的地點(如大公司、體育中心和大學)。
在獻血中心和附屬實驗室,收集生物樣本和結構化數據所需的全部必要基礎設施都已到位。所有獻血者均可獲得用於提取DNA的血漿和全血。血庫基礎設施已配備有受過教育的工作人員(護士、技術人員、IT專家和醫生)的實驗室設施。此外,血庫專業人員促進了血液中各種生物標誌物的檢測,並擁有大規模生物材料儲存方麵的專業知識。
與血庫的參與者接觸是我們研究的基礎。獻血者在到血庫獻血時被要求參與並簽署知情同意書。這份同意書允許我們使用他們過去和未來捐獻的血液樣本來研究遺傳和免疫因素對當前和未來健康和疾病的影響。獻血和參加DBDS的納入和排除標準相同,95%的被邀請獻血者同意參加DBDS。9
調查問卷
從2010年3月到2015年7月,所有參與的捐贈者都必須完成一份四頁的紙質問卷,涉及自我體驗的身心健康問題,包括12項簡表(SF-12)標準化健康調查、吸煙習慣、酒精攝入量、運動、食物攝入量、補充鐵攝入量、身高、體重和腰圍。beplay体育相关新闻共有85000人填寫了紙質問卷。作為最初紙質問卷的後續,我們使用開源調查軟件工具limessurvey開發並實現了一個數字化、靈活的平板電腦問卷平台。10這使得在多個時間點從捐贈地點的參與捐贈者那裏收集關於健康特征的自我報告數據成為一種快速、簡便和具有成本效益的程序。第一份數字問卷於2015年7月至2018年5月實施並使用。調查問卷主要關注以下研究問題:過敏、多動症、偏頭痛、汗腺炎、抑鬱症和不寧腿綜合征。它還包含了紙質問卷中的問題:SF-12,吸煙習慣,酒精攝入量,身高和體重。共有48000名DBDS參與者完成了第一次數字問卷調查。第二份數字問卷於2018年6月啟動。它包括的問題包括:睡眠模式、焦慮、偏頭痛、壓力、皮膚病、子宮內膜異位症、疼痛、學習困難、SF-12、吸煙習慣、飲酒、身高和體重。使用問卷數據,一些研究已經評估了描述獻血者總體健康狀況的因素,例如汗濕症,11感染風險,12偏頭痛、腿不寧和抑鬱。13日14此外,通過重訪樣本,有可能評估感染是否與肥胖相關15以及缺鐵和血紅蛋白水平總體上如何影響捐獻者的健康。16日17
基於注冊數據
在丹麥,人們一直享有平等的醫療保健製度;因此,集中的國家民事和衛生登記處是公正和全麵的衛生保健數據資源。這些登記包括國家病人登記,其中包括1975年以來所有醫院登記的診斷18以及其他專業登記處,例如丹麥出生登記、丹麥死亡原因登記和丹麥統計局監測的社會經濟數據。我們已經在流行病學研究中使用DBDS隊列評估,例如,死亡率19以及獻血對後代出生體重的影響。20.
dbd組織
Pedersen詳細描述了DBDS本身等.9簡單地說,DBDS由一個指導委員會和一個科學顧問委員會管理。所有項目都由DBDS指導委員會管理。涉及DBDS中遺傳數據的遺傳項目由DBDS基因組聯盟(由DBDS指導委員會、deCODE Genetics和科學合作者組成)合作運行。
基因分型:從全血中純化DNA,隨後儲存在−20°C。然後,所有樣本在deCODE genetics使用Illumina公司的全球篩選陣列分兩批進行基因分型(第一批n=85 000和第2批n=25 000)。該陣列具有非常豐富的最新的>65萬個snp的內容,並與Illumina Omni Express芯片進行了優化比較。所有基因型數據同時處理,進行基因型調用、質量控製和歸責。最初,數據缺失超過10%的個體或snp被排除在外,與群體雜合度偏離超過3個SD的個體也被排除在外(校正攜帶大拷貝數變異(CNVs)的個體(>100 Kbp))。
歸責
基因分型數據采用參考板骨幹進行估算,該骨幹包括(1)UK 1 KG phase 3和HapMap參考,用於預測具有小等位基因頻率(MAF)>1%的非基因分型snp;(2)由n>6000丹麥全基因組序列組成的內部數據集,用於提高MAF降至0.01%左右的變異預測。21由於丹麥國家倫理委員會的限製,目前無法預測美國醫學遺傳學和基因組學學院指南中列出的變異。22對於未來的合作研究,倫理委員會將在個案基礎上批準對這些變體的分析。
拷貝數變化
利用b-等位基因計數和對數比的基因型,將cnv稱為pennCNV。23使用<20個SNPs調用的CNVs被排除,剩餘的CNVs被目視檢查以排除假陽性。
統計設計
所有數據都存儲和分析在16 000核心丹麥國家生命科學超級計算機計算機組(http://www.computerome.dtu.dk).數據存儲和計算分析在受保護的私有雲環境中執行。該分析環境能夠動態擴展,並已在超過100台服務器、300多個cpu、超過13 TB RAM和多達5.7 PB (5700 TB)磁盤空間的組合中成功測試。該集群帶有一個預先配置的排隊係統,可以運行虛擬機和容器(如Docker, Singularity),一套超過900個預安裝的工具和包,還可以添加針對機器學習優化的GPU服務器和專門的大內存係統(1 - 8 TB RAM)。
對於測試的每個假設,提供了一個概要,包括詳細的分析計劃。每個概要的信息將作為描述結果的已發表文章的鏈接或在研究網站上作為摘要統計數據發布:http://www.dbds.dk.
樣品
在每次訪問獻血者機構期間(全血獻血者每年最多4次,血漿獻血者每年最多10次),每位參與者捐獻一份EDTA血漿樣本。在納入DBDS時,還要采集一份全血樣本。在納入日期之前采集的血漿樣本被儲存起來用於質量評估,也可用於未來的分析。所有樣本在捐獻後6小時內冷凍,並儲存在主收集管中直到處理。
在每次獻血時進行常規血液測量,包括血型、紅細胞和白細胞計數、血紅蛋白濃度和紅細胞壓積。除常規測量外,還提供與項目相關的測量,例如,評估亞組患者的鐵蛋白水平、感染狀況(巨細胞病毒,剛地弓形蟲而且單純皰疹病毒)、hla分型和其他選定的感染標誌物(循環細胞因子、C反應蛋白等)。
一般數據保護和倫理問題及原則
DBDS已獲得丹麥數據保護機構(2007-58-0015)和科學倫理委員會係統(M-20090237)的必要許可和批準。DBDS基因組聯盟內的新項目將需要國家衛生研究倫理委員會的額外批準。DBDS將負責繼續與丹麥有關當局就DBDS樣本的研究保持聯係,並確保未來獲得許可。
患者和公眾參與
患者和公眾均未參與本研究的設計。
數據可用性聲明
該研究將堅持FAIR (http://datafairport.org/:可查找、可訪問、可互操作和可重用)的概念。因此,在這個法律框架內,DBDS基因組聯盟委員會可以決定如何以及在什麼條件下共享數據。一般而言,相關摘要數據將在接受發表3個月後通過存儲庫公開提供(H2020開放獲取政策)。
迄今為止的發現
已評估的初始質量措施:
種族
根據來自基因分型數據和1000個基因組樣本的~15K個重疊snp,我們確認了預期的DBDS隊列群體結構;大多數參與者是歐洲血統(99%),以下兩個種族群體分別是南亞血統(0.4%)和東亞血統(0.2%)。最近有非洲血統的參與者比例極低(0.002%),考慮到嚴格的捐贈者旅行檢疫規則,這是預期的。使用FlashPCA2評估種族。24
次要等位基因頻率
MAF分布顯示大部分SNPs(84%)在1%以上(圖2),為基因型歸責提供了堅實的依據。
優勢與局限性
連續測量
這種大型獻血者隊列的一個獨特特點是能夠進行連續評估。在標準設置下,參與者通常在基線時間點被招募,並被邀請在接下來的幾年進行一次或兩次後續研究。血庫是一個優勢,因為大多數獻血者在獻血方麵都有長期的承諾關係,而且每年要見一到四次血。25因此,有可能在幾十年內為大量參與者收集數個年度和連續的生物樣本和問卷信息。同樣,來自特定時間點的子組和樣本可以以回顧性的方式使用。
基於國家注冊
丹麥有幾個全麵的國家登記處,其中包括個人一級的健康信息和社會人口統計措施。知情同意允許結合從DBDS參與者和國家登記處獲得的信息;丹麥國家患者登記處(自1977年起)、丹麥癌症登記處(自1943年起)和糖尿病登記處(自1992-2012年起)、丹麥藥品統計登記處(自1994年起)、民事登記處(自1968年起生命狀況、子女數量、出生地、地址、搬遷等)、勞動力市場研究綜合數據庫(自1982年起,如教育水平、職業狀況、收入、社會地位和其他相關參數)。這有利於回顧性、橫斷麵或前瞻性研究,使用基於注冊中心的測量方法結合問卷得出的數據。
供選擇
盡管DBDS參與者與丹麥人群相似,但研究設計中的一些限製可能會影響結果的普遍性。1排除獻血者標準排除了患有通過血液傳播的感染或疾病、體重低於50公斤、男性血紅蛋白水平低於12.9 g/L、女性血紅蛋白水平低於12.0 g/L和有奇怪行為的人:前往肝炎和艾滋病毒高風險國家旅行率高的人、男男性行為者、以前做過性工作者的人、使用過靜脈注射藥物的人以及孕婦。將獻血者的社會人口學參數與丹麥總人口的社會人口學參數進行比較,我們知道非常低收入和高收入的人在獻血者中代表性不足。1在這方麵,我們承認,與傳統的基於人群的研究相比,DBDS缺乏對一般人群某些部分的覆蓋。同樣,基於人口的英國生物銀行研究也報告了“健康誌願者”的偏見。26
討論
DBDS與基因組隊列的擴展將深刻影響可用性,並增強對影響獻血者健康的遺傳、環境和生活方式因素的研究。此外,該研究提供了一個獨特的平台,有助於分析在國家衛生登記中沒有發現的常見表型、疾病恢複因子以及基因與環境之間的相互作用。最後,如此龐大的健康隊列具有為未來精準醫療計劃提供關鍵信息的巨大潛力,類似的努力已經開始,例如,“All of US”(由NIH, US)。在丹麥,我們的優勢是收集了廣泛的國家衛生登記,便於在如此龐大的隊列中對特定疾病/結果進行流行病學研究。對於這些健康記錄中沒有係統監測的表型和症狀,例如,生活方式因素,如吸煙習慣、睡眠模式和自我感知的健康狀況,需要進行大規模的流行病學研究,但通常很難進行。DBDS基因組隊列可以促進此類研究。如上所述,DBDS基因組隊列利用現有的獻血者平台,具有極高的參與率(>95%),這有助於在大型流行病學研究中對獻血者健康進行直接評估。此外,電子問卷平台可以方便快捷地對捐贈人群的子群體進行新的、有針對性的調查。DBDS與來自丹麥健康登記處的結果以及儲存在易於獲取的冰櫃中的數百萬回顧性血漿樣本一起,代表了一個可靠的表型平台,可用於橫斷麵流行病學研究和回顧性生物標誌物研究。我們相信,這些優勢使DBDS基因組隊列在精準醫療領域成為一個強大的競爭對手。
DBDS基因組隊列使我們能夠研究基因-環境相互作用,否則很難研究:測試疾病發展假設,例如,(1)與遺傳因素相互作用的認知表現和癡呆症的風險,(2)確定遺傳和環境因素對表型(如睡眠模式)的貢獻。研究這個問題的一種方法是使用多元回歸模型。作為一個例子,範等最近描述了一個結合時間和空間考慮的基因-環境相互作用分析的高級例子,27基於丹麥民事登記處數據的分析。DBDS基因組隊列對於研究暴露於一種或多種已知疾病風險因素但尚未發展為疾病的個體的抗病性特別有價值。一個這樣的例子可能是參與者攜帶高度可遺傳的特征,如家族中的精神疾病或已知的遺傳風險因素,但他們自己沒有精神疾病。最後,DBDS還提供連續的血漿樣本存儲,這允許連續的血液測量。這些測量可用於研究健康標誌物,如suPAR(可溶性尿激酶纖溶酶原激活受體)和與供體總體健康相關的變異。28
簡而言之,DBDS基因組隊列有助於研究基因組因素對健康特征和狀態的影響。
不同組學的綜合分析,即多組學分析將可能在大型DBDS基因組隊列中實現,這將極大地增加其作為研究獻血者健康狀況以及血液相關特征和狀態之間相關性的資源的價值。我們期望DBDS基因組隊列將有助於發現和驗證疾病的前驅症狀和生物標誌物,從而更好地理解疾病病理並提出新的藥物靶點。
協作
我們鼓勵使用DBDS遺傳聯盟生成的數據進行科學合作。已發表的摘要數據可按要求提供。否則,數據請求必須首先得到DBDS指導委員會的批準,如果該請求被認為超出了DBDS的目標,則必須向國家科學倫理委員會申請。此外,還需要獲得材料轉讓和數據保護協議。請訪問http://www.dbds.dk.
致謝
我們要特別感謝丹麥血庫的工作人員,他們繼續將獻血者納入DBDS,使這項研究成為可能。
參考文獻
腳注
TFH和KB貢獻相同。
貢獻者TFH, KB和KSB構思並計劃了實驗。KB進行了分析。OBP, HH, HP, KN, CE, HU, PJ, TW, JO, GBEJ, MN, SA, PIJ, ES和LT有助於隊列和研究設計。DW、PJC、KB和SB引領了數據基礎設施的設計。CE, KSB, MAHL, ES和MP對數據捕獲有貢獻。TFH、KB和KSB對結果的解釋有貢獻。由TFH、KB和KSB牽頭撰寫。所有作者都提供了批判性的反饋,幫助形成分析和手稿,並批準了最終版本。
資金我們要感謝Grant旗下的丹麥倫德貝克基金會(R209-2015-3500 to Kristoffer Burgdorf)、丹麥行政區域、丹麥獻血者研究基金會(Bloddonorernes Forskningsfond)、Rigshospitalets研究基金會、諾和諾德基金會(NNF14CC0001和NNF17OC0027594)和CANDY基金會(CEHEAD)。
相互競爭的利益沒有宣布。
出處和同行評審不是委托;外部同行評審。參見數據共享聲明
數據共享聲明該研究將堅持FAIR (http://datafairport.org/:可查找、可訪問、可互操作和可重用)的概念。因此,在這個法律框架內,DBDS基因組聯盟委員會可以決定如何以及在何種條件下共享數據。一般而言,相關摘要數據將在接受發表3個月後通過存儲庫公開提供(H2020開放獲取政策)
患者發表同意書不是必需的。