文摘
臨床研究數據鏈接(CPRD)是一個正在進行的初級保健匿名的數據庫從全科醫生的醫療記錄,覆蓋超過1130萬患者在英國從674年實踐。440萬活躍(活著,目前注冊)患者會議質量標準,大約6.9%的英國人都包含和病人廣泛代表性的英國普通人群的年齡、性別和種族。全科醫生是守門的初級保健和專家推薦在英國。因此CPRD初級保健數據庫是一種豐富的健康數據進行研究,包括人口統計數據,症狀,測試,診斷,治療,二級護理與健康有關的行為和推薦。超過一半的患者,連杆與數據集從二級護理,針對疾病的人群和死亡率記錄增強數據用於研究的範圍。CPRD非常廣泛應用在國際上流行病學研究已經用於生產超過1000個研究,發表在同行評議期刊在廣泛的健康結果。然而,研究人員必須意識到定期收集電子健康記錄的複雜性,包括完整性管理變量的方法,誤分類和發展為研究疾病的定義。
CPRD數據被廣泛用於觀察研究。例如,數據被用來顯示沒有MMR疫苗和自閉症之間的聯係,並使用口服類固醇和之間的聯係表現增加骨折的風險。
英國CPRD有大量數據集結合縱向初級保健醫療記錄從參與實踐。超過一半的CPRD病人有資格獲得連接額外的數據集,包括醫院的數據,和國家死亡率的國家癌症登記數據記錄。
一些數據的質量是由質量和結果框架在英國,和數據也由CPRD內部流程監控。分析本文中描述顯示活躍(活著,目前注冊)CPRD患者代表英國人口的年齡和性別。
CPRD數據來源於日常臨床實踐,及其用於流行病學研究通常需要大量的數據處理和理解最初的數據記錄和存儲。
數據資源基礎
英國初級保健的研究數據
超過98%的英國人口注冊一個初級保健全科醫生(GP)1國民醫療服務製度(NHS)下,訪問醫生是免費的。全科醫生是保健的看門人在英國國家衛生服務。GPs作為任何非緊急的第一接觸點與健康有關的問題,這可能會在初級保健管理和/或稱二級護理是必要的。二級護理團隊也反饋信息對病人GPs,包括關鍵的診斷。病人數據通常記錄到計算機實踐人員,針對一個獨特的NHS病人數量。這些方麵的英國初級保健提供良好的健康信息的捕捉縱向電子健康記錄。
臨床研究數據鏈接(CPRD)
CPRD利用通用實踐數據和產生一個初級保健數據集,這是一個最大的數據庫的縱向從世界上初級保健醫療記錄(表1)。成立於1987年的倫敦,小增值醫療產品(鞋麵)數據集已成為慣例研究數據庫(大)1993年,2,3在2012年擴大成為CPRD之前。的CPRD整理定期收集匿名電子健康記錄數據從通用實踐人在實踐層麵上同意每月提供數據。所有患者注冊參與實踐中包括數據集,除非他們有單獨要求退出的數據共享,通過詢問醫生修改他們的注冊信息在係統中禁用的提取數據。
縣參與 | 英國:英格蘭、威爾士、蘇格蘭和愛爾蘭Nortdern |
包括是誰? | 患者注冊通用實踐貢獻數據CPRD,沒有異議GP patient-identifiable數據的二次使用 |
記錄是什麼? | 統計學、診斷、症狀、標誌、處方、推薦,免疫行為因素,測試 |
的數據收集 | 1987年至今 |
平均隨訪時間5.1年 | |
資金來源 | 從MHRA CPRD已經收到資金,威康信托基金會醫學研究理事會NIHR衛生技術評估項目,創新藥物計劃,英國衛生部技術戰略委員會、歐盟第七框架計劃,和各種大學、合同研究機構和製藥公司 |
縣參與 | 英國:英格蘭、威爾士、蘇格蘭和愛爾蘭Nortdern |
包括是誰? | 患者注冊通用實踐貢獻數據CPRD,沒有異議GP patient-identifiable數據的二次使用 |
記錄是什麼? | 統計學、診斷、症狀、標誌、處方、推薦,免疫行為因素,測試 |
的數據收集 | 1987年至今 |
平均隨訪時間5.1年 | |
資金來源 | 從MHRA CPRD已經收到資金,威康信托基金會醫學研究理事會NIHR衛生技術評估項目,創新藥物計劃,英國衛生部技術戰略委員會、歐盟第七框架計劃,和各種大學、合同研究機構和製藥公司 |
縣參與 | 英國:英格蘭、威爾士、蘇格蘭和愛爾蘭Nortdern |
包括是誰? | 患者注冊通用實踐貢獻數據CPRD,沒有異議GP patient-identifiable數據的二次使用 |
記錄是什麼? | 統計學、診斷、症狀、標誌、處方、推薦,免疫行為因素,測試 |
的數據收集 | 1987年至今 |
平均隨訪時間5.1年 | |
資金來源 | 從MHRA CPRD已經收到資金,威康信托基金會醫學研究理事會NIHR衛生技術評估項目,創新藥物計劃,英國衛生部技術戰略委員會、歐盟第七框架計劃,和各種大學、合同研究機構和製藥公司 |
縣參與 | 英國:英格蘭、威爾士、蘇格蘭和愛爾蘭Nortdern |
包括是誰? | 患者注冊通用實踐貢獻數據CPRD,沒有異議GP patient-identifiable數據的二次使用 |
記錄是什麼? | 統計學、診斷、症狀、標誌、處方、推薦,免疫行為因素,測試 |
的數據收集 | 1987年至今 |
平均隨訪時間5.1年 | |
資金來源 | 從MHRA CPRD已經收到資金,威康信托基金會醫學研究理事會NIHR衛生技術評估項目,創新藥物計劃,英國衛生部技術戰略委員會、歐盟第七框架計劃,和各種大學、合同研究機構和製藥公司 |
數據鏈接
英語實踐的一個子集(目前為75%),代表58%的英國所有CPRD實踐)已同意參與CPRD連鎖計劃和患者的立場提供了信息。患者的立場的實踐數據鏈接通過一個受信任的第三方(健康與社會保健信息中心4)其他現有的數據源。包括醫院統計數據集建立聯係5(住院數據),國家統計局6(包括死因死亡率數據),多個剝奪和湯森分數指數(剝奪數據)和疾病登記包括美國國家癌症情報網絡,7國家審計項目和心肌缺血8(細節補充表1,可用補充數據在IJE在線)。其他聯係計劃(見CPRD網站9),研究人員可以要求定製鏈接個人研究。
用於觀察研究和幹預研究
受到適當的數據治理和批準,CPRD可以提供初級保健和與國際研究人員在英國和病人數據。通過CPRD,研究人員可以方法實踐和病人參與biosample收集研究或試驗。這項工作的可行性測試:患者從CPRD已經招募了藥理遺傳學研究statin-induced肌病,10,11實踐了集群隨機試驗12,13和病人已經招募了務實的即時隨機試驗。14可以使用電子健康記錄數據與研究數據提供一個完整的臨床征象招募病人。
道德
CPRD已經廣泛的國家研究倫理服務委員會(nr)倫理批準純粹觀察研究使用初級護理數據,建立了聯係。其他用途的CPRD數據可能需要單獨的倫理審批。這可能是如果有任何特定的患者參與研究;例如,如果研究者希望問病人為病人報告結果完成一份調查問卷,或者進行介入審判CPRD患者。
數據治理、實踐和病人的隱私
CPRD努力經營在英國和歐洲的法律來保護保密。治理要求保護病人的隱私,尊重沒有得到病人同意通過確保病人標識符分開舉行有分離的臨床數據和研究人員提供身份信息從主學習和那些使用CPRD數據。
資金來源
CPRD是合資企業的藥品和醫療管理機構(MHRA)和國家衛生研究所(NIHR)。CPRD屬於英國衛生部在MHRA和運作。CPRD已經收到MHRA資助研究,威康信托基金會醫學研究理事會NIHR衛生技術評估項目,創新藥物計劃,英國衛生部技術戰略委員會、歐盟第七框架計劃和各種大學、合同研究機構和製藥公司。
數據資源麵積和人口覆蓋率
圖1描述CPRD初級保健的人口覆蓋率數據在英格蘭、威爾士、蘇格蘭和北愛爾蘭。在年中日期2013年7月2日,數據集信息1130萬年舉行的病人被認為可以接受的研究基於數據質量檢查(附錄1、可用補充數據在IJE在網上,和下麵描述)。活躍的病人的人口(活著,目前注冊)2013年7月2日是440萬年,占英國總人口的6.9%(基於英國2013年中6410萬人口)。剩下的690萬條記錄代表不活躍的患者死亡或不再注冊參與實踐。病人數量按年齡、性別、剝奪、種族和地區中描述表2。
。 | 所有的病人。 | 活躍的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年齡在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地區,n(%) | ||
北東 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
約克郡與亨伯 | 441933 (3.9) | 48480 (1.1) |
東米德蘭茲 | 446799 (4) | 29954 (0.7) |
西米德蘭茲郡 | 943011 (8.4) | 394115 (8.9) |
英格蘭東部 | 1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
倫敦 | 1532066 (13.6) | 600824 (13.6) |
南東部海岸 | 1130468 (10) | 474593 (10.7) |
北愛爾蘭 | 275640 (2.4) | 153576 (3.5) |
蘇格蘭 | 960121 (8.5) | 499969 (11.3) |
威爾士 | 829703 (7.3) | 403172 (9.1) |
隨訪持續時間(平均年,差)一個 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
。 | 所有的病人。 | 活躍的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年齡在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地區,n(%) | ||
北東 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
約克郡與亨伯 | 441933 (3.9) | 48480 (1.1) |
東米德蘭茲 | 446799 (4) | 29954 (0.7) |
西米德蘭茲郡 | 943011 (8.4) | 394115 (8.9) |
英格蘭東部 | 1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
倫敦 | 1532066 (13.6) | 600824 (13.6) |
南東部海岸 | 1130468 (10) | 474593 (10.7) |
北愛爾蘭 | 275640 (2.4) | 153576 (3.5) |
蘇格蘭 | 960121 (8.5) | 499969 (11.3) |
威爾士 | 829703 (7.3) | 403172 (9.1) |
隨訪持續時間(平均年,差)一個 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
活躍的病人還活著,目前注冊2013年7月2日。
一個隻包含標準的後續。
。 | 所有的病人。 | 活躍的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年齡在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地區,n(%) | ||
北東 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
約克郡與亨伯 | 441933 (3.9) | 48480 (1.1) |
東米德蘭茲 | 446799 (4) | 29954 (0.7) |
西米德蘭茲郡 | 943011 (8.4) | 394115 (8.9) |
英格蘭東部 | 1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
倫敦 | 1532066 (13.6) | 600824 (13.6) |
南東部海岸 | 1130468 (10) | 474593 (10.7) |
北愛爾蘭 | 275640 (2.4) | 153576 (3.5) |
蘇格蘭 | 960121 (8.5) | 499969 (11.3) |
威爾士 | 829703 (7.3) | 403172 (9.1) |
隨訪持續時間(平均年,差)一個 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
。 | 所有的病人。 | 活躍的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年齡在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地區,n(%) | ||
北東 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
約克郡與亨伯 | 441933 (3.9) | 48480 (1.1) |
東米德蘭茲 | 446799 (4) | 29954 (0.7) |
西米德蘭茲郡 | 943011 (8.4) | 394115 (8.9) |
英格蘭東部 | 1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
倫敦 | 1532066 (13.6) | 600824 (13.6) |
南東部海岸 | 1130468 (10) | 474593 (10.7) |
北愛爾蘭 | 275640 (2.4) | 153576 (3.5) |
蘇格蘭 | 960121 (8.5) | 499969 (11.3) |
威爾士 | 829703 (7.3) | 403172 (9.1) |
隨訪持續時間(平均年,差)一個 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
活躍的病人還活著,目前注冊2013年7月2日。
一個隻包含標準的後續。
數據收集的頻率
發生了數據收集的一部分正常的患者參與臨床護理實踐在日常生活。數據記錄的頻率是由病人的需要和不同的年齡、性別和潛在的發病率。病人都包含在初級保健數據集從第一次到最後接觸參與實踐。通常實踐和收集的數據上傳到CPRD每月安全服務器。最後數據收集對應日期的日期的最後從每個實踐數據上傳。每月構建的初級保健數據集生成,供研究人員使用。
措施
實踐和病人數據
數據庫結構廣泛信息分為臨床、轉診、免疫接種、測試和治療數據(見補充表1,可用補充數據在IJE在線)。數據記錄與pseudo-identifiers實踐和耐心。在實踐層麵,地理區域是由CPRD記錄10的地區之一在英格蘭,威爾士,蘇格蘭和北愛爾蘭作為單獨的區域(圖1);實踐層麵剝奪分數也是超級計算基於實踐低輸出區域。
所有慣例鼓勵遇到電子記錄和實踐者提供這些記錄進行研究。數據收集統計信息,處方細節,臨床事件(症狀,診斷),提供預防保健,測試,免疫專家推薦,住院和主要結果,有關死亡(的細節都顯示在細節補充表2,可用補充數據在IJE在線)。
所有條目一個病人記錄都視為“磋商”,並不是所有的將涉及麵對麵的接觸。在谘詢多個“事件”可能被記錄,每個都有一個關聯的日期(圖2)。
數據在很大程度上是由全科人員記錄使用版本2閱讀代碼,一個層次的臨床分類係統包含超過96,000碼。15例如,在谘詢、醫生、護士、其他醫療專業,實踐經理或管理員可以進入許多閱讀代碼來描述病人的條件(例如生活方式等措施吸煙狀況、症狀、過去病史,診斷,測試執行如血壓測量,和治療提供)。數字數據在額外的臨床措施(如身高、體重、血壓、飲酒)也可以被記錄在磋商。處方醫生簽發的自動記錄產品名稱和英國國家規定的代碼,與劑量和數量的指令。實驗室測試的結果由全科醫生通常通過電子鏈接添加到病人記錄實驗室。其他來源的數據反饋給醫生也可能進入病人記錄實踐人員;這可能包括信息等二級護理的關鍵診斷,從醫院排放數據,或從專家門診隨訪信息。
全科醫生也能夠對病人做出額外的未編碼的筆記和觀察自由文本。這通常包含身份信息和不屬於標準數據庫提供給研究人員。
數據資源的使用
CPRD數據(或以前大或鞋麵)在英國和國際16生產近2000研究報告,超過1000發表在同行評議的雜誌上發表論文,在所有主要治療領域。參考書目是由CPRD維護網上。17這些出版物涵蓋一係列健康相關研究主題包括藥物,療效比較研究,衛生服務研究,評估時間的發病率趨勢,衛生經濟學,預後研究,經典危險因素流行病學和最近隨機對照試驗。12,18日期的出版物包括研究表明缺乏之間的關聯麻疹、腮腺炎和風疹疫苗(MMR)與自閉症,19急性感染後,心血管疾病的風險20.他汀類藥物使用相關的癡呆的風險較低,21牛皮癬患者的心肌梗死的風險,22口服糖皮質激素與骨折風險的使用23和身體質量指數和癌症之間的聯係。24
的優點和缺點
的優勢
CPRD數據作為研究資源的優勢在於覆蓋的廣度,大小、長期隨訪、代表性和數據質量。
寬度的數據
CPRD初級保健數據集是一些大型之一,正在進行的數據庫,包括發病率和生活方式的變量和數據鏈接二級護理和死亡率數據。
大小和長期隨訪
這個數據庫的關鍵力量是它的大小;CPRD持有數據從674年實踐,包括超過7900萬人年隨訪(2013年7月2日,2014年1月的數據集)。這允許詳細的流行病學協會調查,估計更高層次的統計精度比與較小的數據是可能的來源,這是特別重要的研究罕見的曝光和疾病。25,26個別患者中,有一個中等的前瞻性隨訪9.4年活躍的患者(四分位範圍(差)3.4 - -13.9)和5.1年(差1.8 - -11.1年)(表2)整體,使研究疾病與長期延遲和長期的研究結果。-
代表性
與英國2011年的人口普查相比,30.CPRD病人廣泛代表性的英國人的年齡和性別(圖3)。病人也相當於英國人口的種族,31日並與健康調查英國身體質量指數分布在大多數患者亞組。32然而,CPRD可能並不代表所有的實踐在英國基於地理位置和大小。33
數據質量
英語方麵的數據質量慣例是由質量和增強的成果框架,34GPs的獎金計劃,鼓勵記錄的關鍵數據項(例如吸煙狀況和服務交付的關鍵病人組)。質量和結果框架在2004年推出的時候,和完整性在許多變量的記錄顯示後續改進(圖4,補充圖1,可用補充數據在IJE在線)。
驗證CPRD顯示高陽性預測值的診斷和評估,發病率的比較與其他英國數據源也大體相似。35-38然而,報告的驗證的研究往往是太窮,允許一個明確的解釋,和大多數的研究集中在積極的預測價值,而非敏感性和特異性。39
初級保健的質量數據是變量,因為數據輸入由GPs例行磋商期間,沒有為目的的研究。因此,研究人員必須研究之前進行全麵數據質量檢查。CPRD提供兩套數據質量標準:為病人和可接受性標準(ut)實踐的時候了。這些標準並不保證數據質量,但CPRD建議這些措施作為第一步選擇病人研究質量和質量數據記錄的時期。病人可接受的度量是基於注冊狀態,記錄病人的事件記錄,和有效的年齡和性別。生產日期是基於實踐的質量度量基於記錄的連續性和死亡記錄的數量。生產日期計算出每個參與實踐,實踐的最新日期對應滿足這些最低質量標準(附錄1、可用補充數據在IJE在線)。本文給出的數據反映數據貼上患者可以接受,至少有1天的後續“標準”。數據質量的研究表明,盡管這些標準,有大變化inter-practice記錄的數據。40
弱點
缺失的數據
在病人和完整性的變化數據跨越時間需要仔細考慮;限製那些有完整的數據可能會導致偏見的分析,和歸責可能並不是一個簡單的方法,因為missingness的模式是複雜的。例如,身體質量指數可能更頻繁地記錄患者的健康問題,和血壓更頻繁地在生育年齡的婦女和那些與現有的心血管疾病。複雜的算法往往需要處理missingness,解決差異的措施之間的協商和決定是否曆史測量數據,例如身體質量指數、血壓或吸煙狀態,仍適合病人的疾病風險在後續很久以後。32
初級保健數據的額外的複雜性疾病的缺乏閱讀代碼必須被視為一個沒有疾病的本身,因此而陽性預測價值往往是高,39敏感性可能會更低。這一潛在錯誤分類的出現一定程度上是由於患者未能給疾病的醫生,也從不同GPs在編碼診斷病人電子記錄;如果GPs作為自由文本輸入信息,研究人員將小姐有價值的信息。疾病之間的誤分類的程度可能不同。39
定義
沒有一般標準化診斷和其他細節的定義,所以閱讀代碼列表和算法需要為每個開發研究識別風險和利益的結果。這可能會導致不一致的定義(因此結果)之間使用相同的數據研究。
信息從二級護理
一般實踐獲得的信息與二級護理病人接觸但這信息必須手動輸入到病人記錄。因此,住院的詳細信息(日期、診斷、測試執行,滯留時間)可能是不完整的。
數據不捕獲
健康的某些方麵可能很少或根本沒有記錄,例如社會支持水平,許多人在一個家庭,非處方藥物使用,在二級護理處方,處方,和堅持治療。也有某些病人團體從初級護理記錄缺失,如囚犯,私人病人,一些住宅和無家可歸的人。
數據資源訪問
訪問病人水平數據由CPRD提供衛生研究目的,依賴於批準協議的一項研究MHRA獨立科學谘詢委員會(直接督導下的)。
研究人員打算利用數據應該意識到CPRD數據文件包含數百萬行數據,需要廣泛的數據管理和深入理解數據輸入和存儲的方式。
CPRD提供數據字典和編碼字典研究人員,並指導創建代碼清單可以幫助識別感興趣的代碼。41閱讀代碼存儲庫電子健康記錄的研究現在還可用。42,43
細節直接督導下的應用程序和數據成本可用CPRD網站,和任何其他查詢可以指向CPRD知識中心(kc@cprd.com)。9
資金
LS支持威康信托基金會高級臨床科學研究獎學金授予098504號/ Z / 12 / Z。
利益衝突:AG是受雇於CPRD和電視CPRD的雇員。沒有其他的衝突。
引用