條文本
摘要
客觀的研究首次接種後6個7天間隔內COVID-19疫苗的有效性,並評估觀察數據的潛在偏差。
設計和設置回顧性隊列研究使用哥倫比亞大學歐文醫學中心的數據與州和城市免疫登記。
結果和措施我們使用了與多達54 987個協變量匹配的大規模傾向評分,擬合了Cox比例風險模型,並為兩個主要結果(COVID-19感染和COVID-19相關住院)構建了Kaplan-Meier圖。我們對兩組患者第1周的病例進行了手工圖表回顧,並對其他指標日期、結果和人群選擇進行了一組二次分析。
結果該研究包括177666名患者。我們觀察到,第一劑mRNA疫苗在第6周後的有效性有所提高,對COVID-19感染的有效性約為84% (95% CI 72%至91%),對COVID-19相關住院的有效性約為86% (95% CI 69%至95%)。在分析第1周出乎意料的高有效性時,圖表回顧顯示,接種疫苗的患者在接種疫苗後不太可能尋求護理,更有可能在遇到其他情況時被診斷為COVID-19。二級分析強調了《國際疾病分類》第十版、臨床修正診斷的潛在結果錯誤分類、排除既往COVID-19感染患者和未暴露組中錨定的影響。在完全接種疫苗的患者中,長期疫苗的有效性與隨機試驗的結果一致。
結論對於疫苗有效性研究,需要仔細檢查觀察數據,以確保比較組表現出類似的尋求健康的行為,並同樣有可能在數據中被捕獲。雖然我們發現,盡管前幾周存在偏差,但研究可能能夠準確估計長期有效性,但每項研究都應該報告前幾周的結果,以便我們更好地理解偏差。由於疫苗暴露的時間趨勢和患者基線特征的差異,間接比較疫苗可能產生偏誤的結果。
- 新型冠狀病毒肺炎
- 衛生信息學
- 流行病學
數據可用性聲明
所有與研究相關的數據都包含在文章中或作為補充信息上傳。由於當地的信息治理和數據保護法規,在沒有得到數據管理員批準的情況下,不能共享患者級數據。
這是一篇開放獲取的文章,按照創作共用署名非商業性(CC BY-NC 4.0)許可發布,該許可允許其他人以非商業性的方式發布、混編、改編、構建本作品,並以不同的條款授權他們的衍生作品,前提是原創作品被正確引用,給予適當的榮譽,任何更改都被注明,且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/.
來自Altmetric.com的統計
本研究的優勢和局限性
本研究使用減少潛在混淆的方法(大規模傾向評分匹配、陰性對照校準),並在第1周對病例進行手工圖表回顧,徹底調查每周COVID-19疫苗的有效性。
該研究包括一係列針對不同患者群體、錨定策略和結果定義的二次分析。
這項研究使用了常規收集的臨床實踐數據,這些數據代表了真實的患者,但也隱含著錯誤分類的風險。
背景
隨機臨床III期試驗顯示,四種最常用的COVID-19疫苗對有症狀的COVID-19感染具有較高的療效,Ad26.COV2的有效率從66.9%到70.4%不等。S(強生-楊森)和ChAdOx1(阿斯利康)到BNT162b2(輝瑞- biontech)和mRNA-1273 (Moderna)疫苗的94.1%和94.6%。1 - 4它們的快速批準和廣泛使用需要強大的上市後研究,利用大樣本量、異質人群和觀察數據中可用的較長隨訪時間。
最近的觀察性研究顯示,其有效性與全球的隨機臨床試驗(rct)相似,包括陰性試驗和隊列試驗,5 - 12其次是對不同患者群體、變異和劑量的研究。13 - 17
然而,如果沒有考慮到這些偏差,與使用觀察數據相關的挑戰,如數據捕獲不完全、結果分類錯誤和適當的比較器抽樣,可能會破壞研究結果。18對於COVID-19疫苗,與疫苗狀態錯誤分類相關的問題,19將接種疫苗和未接種疫苗的人群進行匹配,6解決疾病風險因素混淆和確定偏差20 21還有一些人被撫養。
其中一個問題是COVID-19疫苗在第一次注射後的前2周內的有效性。研究結果顯示,輝瑞-生物科技疫苗的有效性從52%的中等有效性不等3.達到了92.6%的高效率。22同樣,最近的一項研究表明,Janssen疫苗在第一周出現了無法解釋的高效率。23其他研究簡單地將第一周排除在患病時間之外。9 13 - 26雖然在長期疫苗有效性研究中,第1周缺乏有效性被認為是缺乏混淆的衡量標準,但有效性高的原因及其對總體有效性結論有效性的影響仍不清楚。9
本研究的目的是檢查第一次接種後6個7天間隔內的COVID-19疫苗有效性,以評估與使用短期疫苗有效性觀察數據相關的潛在偏差及其對長期疫苗有效性估計的影響。我們采用了大規模傾向評分匹配和許多陰性對照來減少偏差,並利用一係列二次分析和人工回顧第1周的COVID-19感染病例,以檢查接種疫苗和未接種疫苗的患者的求診行為。
方法
主要設計
在這項回顧性觀察隊列研究中,我們使用了哥倫比亞大學歐文醫學中心(CUIMC)數據庫中的電子健康記錄(EHR)。在線補充附錄1),它與紐約市和州公共衛生部門的疫苗登記處有一個持續的自動化連接,包括為我們的人口提供的所有州內疫苗接種。這些數據被翻譯成OMOP通用數據模型版本5,並在多項研究中使用。27
在我們的主要分析中,我們研究了兩種mRNA疫苗(Pfizer-BioNTech或Moderna)。暴露組包括第一次接種相應疫苗之一的患者,此前沒有感染COVID-19,也沒有接觸過其他COVID-19疫苗。對於未暴露組,我們選擇了未接種疫苗的患者,並將他們的索引日期設置為與暴露組參與者之一的索引日期匹配的日期(不一定與任何醫療事件)。暴露組和未暴露組都有至少365天的觀察,根據他們的郵政編碼主要居住在紐約市。不居住在紐約的患者被排除在研究之外,以確保可靠的疫苗接種數據采集。
相關結果包括(a) COVID-19感染定義為COVID-19檢測(逆轉錄酶PCR檢測)陽性或COVID-19診斷代碼;(b) COVID-19住院定義為在就診前或就診期間30天內與COVID-19檢測陽性或診斷相關的住院就診。在進一步檢查結果時,我們增加了兩個其他結果:(a)僅COVID-19檢測陽性和(b)與COVID-19檢測陽性相關的COVID-19住院。設計概述在在線補充附錄2;提供了代碼列表和表型定義的鏈接在線補充附錄3.
我們計算了在第一劑後連續6個7天間隔內的疫苗有效性。在每個間隔時間內,隨訪患者,直到出現結果、周期結束或死亡(以較早者為準)。此外,鑒於第一劑疫苗接種後第一周的疫苗有效性結果,我們對在上述期間記錄的covid -19檢測呈陽性的患者進行了圖表回顧。我們回顧了接種疫苗人群的所有病例以及未接種疫苗人群的隨機樣本,提取了主要症狀、COVID-19曆史,包括症狀(發燒、呼吸短淺、喉嚨痛、咳嗽等)、嚴重程度、從首次症狀到出現的時間以及接觸COVID-19的時間。
二次分析
我們還進行了一係列的二次分析。首先,鑒於已發表的研究關注的是之前沒有感染COVID-19的患者,我們研究了所有符合條件的患者,無論他們之前的COVID-19狀態如何。
據報道,未接種疫苗組指標日期選擇策略(錨定)會影響結果發生率和基線特征,28 29我們還對未暴露的患者進行了檢測,這些患者在3天走廊內與暴露組參與者之一的指數日期匹配,且在紐約至少有365天的觀察。
最後,我們評估了至少接種過一劑COVID-19疫苗的患者和完全接種疫苗的患者的疫苗有效性,並將估計結果與隨機對照試驗的結果進行比較。後者定義為第二劑輝瑞-生物技術或Moderna疫苗或第一劑楊森疫苗後14天。對於每次比較,我們估計了風險比(hr),並構建了如下所示的Kaplan-Meier圖。
統計方法
對於每一項分析,我們擬合一個套索回歸模型來計算傾向評分,並將每個暴露組和未暴露組的患者按1:1的比例進行匹配。對於大規模傾向評分模型,我們使用了所有人口統計信息、指數年和月,以及訪問次數、病情和藥物組、程序、設備暴露、實驗室和儀器測試和其他長期(前一年)和短期(前一個月)的觀察結果。30 31
對於每個結果,我們擬合Cox比例風險模型來估計hr,並構建Kaplan-Meier圖。基於陰性對照結果的經驗校準被用於通過校準hr和95%置信區間(ci)來識別和最小化任何潛在的殘留混雜。32 33疫苗有效性計算為100%×(1−HR)。
所有的分析都由OHDSI基礎設施(CohortMethod包可在https://ohdsi.github.io/CohortMethod/, feature ureextraction可在https://ohdsi.github.io/FeatureExtraction/以及用於大規模正則化回歸的Cyclops軟件包34可以在https://ohdsi.github.io/Cyclops).
診斷
我們使用多種診斷來源來估計潛在的偏差和混淆,遵循最佳實踐來生成證據。35首先,在進行結果建模和效果估計之前,我們檢查了協變量和傾向評分平衡,以確保我們有足夠的樣本量,並對觀察到的潛在混雜進行控製。35我們繪製傾向評分,以調查基線患者人群的重疊,並檢查所有基線特征的平衡,以確定暴露和未暴露隊列在基線和傾向評分匹配後是否不平衡。如果傾向性評分匹配後所有協變量的標準化均數差小於0.1,則認為暴露和未暴露隊列是平衡的。36
對於負控製校正,我們使用了93個負控製(在線補充附錄4)與COVID-19疫苗之間沒有已知的因果關係。陰性對照的選擇基於對現有文獻、產品標簽和自發報告的回顧,並由臨床醫生進行審查。37我們從陰性對照估計中評估剩餘偏差。
患者和公眾的參與
沒有病人參與。
結果
病人的特點
在2021年1月至5月期間,我們總共發現了177666名至少接種過一劑COVID-19疫苗的患者:12771名輝瑞- biontech患者,52728名Moderna患者,5167名Janssen (表1).樣本包括來自所有年齡組的患者,在住院和門診環境中捕獲有或無共病。
我們觀察到未接觸的患者(表1)平均更年輕,有更少的合並症,在匹配之前接觸各種藥物的次數也更少。通過傾向評分匹配,我們能夠在所有協變量(最多55487個協變量,標準化的均數差小於0.1)上實現平衡。圖1展示了協變量平衡和傾向得分平衡圖,顯示在某一天錨定未接種疫苗的患者比在就診時錨定患者能實現更好的平衡。
接種Pfizer-BioNTech的患者與接種Moderna的患者相比具有相似的基線特征分布,但與接種Janssen的患者不同。平均而言,後者更年輕,有更多黑人種族的患者,並有更多的共病,如糖尿病或高血壓(表1).
在調查疫苗接種途徑時,我們發現112963名患者(93%的患者至少使用過一劑輝瑞- biontech)使用過兩劑輝瑞- biontech, 42384名(80%)患者使用過兩劑Moderna。我們發現344名和291名患者使用了三劑相應的疫苗,440名患者使用了不同組合的輝瑞-生物技術、Moderna和Janssen混合疫苗。
在我們的數據庫中,Moderna很早就被使用了,在2021年1月達到峰值(圖2),而輝瑞-生物科技和楊森疫苗接種在4月達到高峰。這反映在隨訪時間上,Moderna患者的平均隨訪時間較長,有些患者的隨訪時間長達5.8個月。
主要每周有效性分析
圖3與未接種疫苗的患者(115689)相比,接種了至少一劑輝瑞- biontech或Moderna疫苗的患者(160114例)在6個7天間隔內的疫苗有效性。由於樣本量小,我們無法獲得楊森的每周穩定估算值。
而第一周的特點是出乎意料的高效(58%;對COVID-19感染的可信區間為45%至69%和72%;對COVID-19相關住院的95% CI為57% - 83%),我們觀察到從第2周開始,有效性似乎在增加,第6周對COVID-19感染的有效性約為84% (95% CI 72% - 91%),對COVID-19相關住院的有效性約為86% (95% CI 69% - 95%)。
然後,我們觀察了第一周的COVID-19感染病例,以解釋高效率(圖4).對第一周COVID-19檢測呈陽性的圖表回顧顯示,未接種疫苗的患者尋求與COVID-19症狀或COVID-19暴露相關的治療的比例很高(85%),而接種疫苗的患者隻有61%。在接種疫苗的人群中,最初的醫療接觸往往與其他醫療原因有關,如共病或手術(39%相比,未接種疫苗的人群為14%,在線補充附錄5).此外,在接種疫苗的隊列中,觀察到的症狀出現和初次保健接觸之間的差距更明顯,因為患者將其症狀歸因於暫時的疫苗副作用,而不是COVID-19感染。
在觀察指標日期後第1周首次接觸COVID-19症狀的嚴重程度時,我們觀察到,未接種疫苗的隊列中無症狀病例比例更高(39%,而接種疫苗的隊列中有18%),而接種疫苗的人群中有更多的嚴重或輕微病例(分別為34%和48%)。
二次分析
由於隊列分析允許我們構建Kaplan-Meier曲線來評估隨時間變化的有效性,我們還觀察了第一劑後一年內的有效性(在線補充附錄6-8).我們觀察到類似的趨勢,三種疫苗在第一次注射後的第一個月內效果都較差。此後,輝瑞-生物科技和Moderna對COVID-19感染和與COVID-19相關的住院都非常有效,而Janssen疫苗表現出廣泛的有效性(在線補充附錄9).
從完全接種疫苗開始有危險時間的完全接種疫苗患者的結果與相應疫苗的臨床試驗結果相匹配(詳細估計見在線補充附錄10和11).
我們最初的設計包括COVID-19陽性檢測或診斷代碼作為結果。在進一步的病例檢查中,我們發現CUIMC數據中的COVID-19診斷代碼部分分配給了在診斷當天或隨後立即出現的COVID-19檢測陰性的患者。在該案例中,為了計費目的(COVID-19分子或抗體檢測)或COVID-19後遺症,係統輸入了《國際疾病分類,第十版,臨床修訂(ICD-10-CM)代碼U07.1“由嚴重急性呼吸綜合征冠狀病毒2型引起的疾病”。因此,我們隻關注COVID-19檢測陽性的主要結果,這導致所有疫苗的有效性高於同時使用陽性檢測和診斷(在線補充附錄9).
最後,在我們的主要分析中排除了之前感染過COVID-19的患者,從而獲得了更高的有效性。無論患者之前的COVID-19狀態如何,納入患者導致觀察到的有效性略有下降(在線補充附錄12)用於接種Moderna或Janssen疫苗的患者的COVID-19感染和住院。
討論
在這項回顧性隊列研究中,我們在第一次注射後的6個7天間隔內檢查了COVID-19 mRNA疫苗的有效性。我們在第一劑後仔細檢查了mRNA疫苗的有效性,並證實了在前2周內疫苗有中等效力的發現。在第一劑疫苗接種後的第1周,我們發現在接種疫苗和未接種疫苗的人群中,之前未發現的差異偏差導致了疫苗的高有效性。其他研究人員建議,接種疫苗和未接種疫苗的人群之間的差異可以通過調整之前的醫療保健利用,如基線前的就診次數、共病或之前的接種行為來減輕。6 13日24然而,即使控製了大量的協變量,包括上述的協變量,我們觀察到的混雜仍然存在。
疫苗接種直接影響了患者對其症狀的態度,導致求醫的延遲和求醫或接受檢測所需的更高症狀嚴重程度閾值。相反,在其他研究中,接種疫苗的患者比未接種疫苗的患者有更高的檢出率。20 38這表明,患者對感染和檢測風險的態度可能因地域和時間的不同而不同。類似地,測試的頻率可能取決於本地政策和實踐。
在未接種疫苗的患者中,輕微的covid -19相關症狀是尋求治療的原因;在接種疫苗的患者中,這類病例主要是在因其他疾病尋求門診和住院治療時發現的。
例如,接種疫苗的患者可能因擇期手術或分娩而住院,並在入院當天或之後對COVID-19檢測呈陽性。其他疫苗的不同症狀嚴重程度以前也有報道39並可能影響任何使用住院作為COVID-19嚴重程度替代品的觀察性研究,因為很難在結構化數據中準確確定住院的主要原因。
以前的研究表明,接種疫苗的患者在接種疫苗後不會立即增加病例數量,因為他們不太可能在生病時接種疫苗。9點40我們在第1周對病例的回顧增加了“健康的疫苗接種者”效應,表明接種疫苗的患者更有可能將其症狀歸因於常見的疫苗副作用,因此不太可能尋求治療。
然而,即使存在這種差異偏差,後續幾周對COVID-19疫苗有效性的估計仍與隨機對照試驗的結果相符。這表明接種疫苗後第1周的高有效性並不一定會影響後續疫苗有效性的估計。另一方麵,我們反對使用疫苗接種後短時間內疫苗有效性的估計作為陰性對照,因為本研究中觀察到的組之間的差異可能有時間差異,並可能隨著時間的推移而減少。41
我們的二次分析發現,在對觀察數據進行疫苗有效性研究時,必須考慮到一些挑戰和潛在偏差。首先,我們觀察到結果定義容易產生測量誤差,這一點還沒有得到充分的研究。一些已發表的研究使用ICD-10或ICD-10- cm編碼來確定COVID-19結果。42-44我們發現,數據捕獲和計費流程的細節與一些患者分配的COVID-19診斷代碼有關,用於計費檢測,而不是作為活動性疾病的指標。指定代碼的另一個原因是COVID-19後遺症,其中COVID-19的實際感染日期可能是過去6個月到幾周的任何時間。一些研究人員此前報道了ICD-10診斷代碼對COVID-19的高陽性預測價值,這指出,每個參與分析的機構都應該仔細檢查指標數據的錯誤分類,以做出有效的推斷。45 46
第二,納入或排除之前感染過COVID-19的患者影響估計療效。我們觀察到,無論結果定義如何,將既往患有COVID-19的患者納入疫苗都會導致所有疫苗的有效性較低。
第三,必須為未接種疫苗的隊列選擇一個適當的指數事件(錨點)來代表接種疫苗的反事實。29日47在我們的研究中,我們證實,任意日期代表著比COVID-19疫苗接種的醫療訪問更好的反事實,這反映在傾向得分平衡和協變量平衡中。然而,其他機構可能有不同的接種途徑,如出院接種,這可以使訪問接種更好的反事實。更一般地說,疫苗接種數據捕獲的完整性是影響研究穩健性的一個關鍵特征。雖然CUIMC數據通過將EHR與城市和州登記處聯係起來,確保了完全的暴露捕獲,但研究人員在對未知疫苗捕獲的數據源進行研究時應保持謹慎。
總的來說,我們的研究結果支持rct和之前發表的所有三種疫苗的上市後研究。接種了COVID-19 mRNA疫苗的患者的樣本量越大,我們就有更大的力量,這導致了與rct相比重疊但更窄的ci。另一方麵,我們的研究中使用Janssen疫苗的患者較少,這導致了與Janssen疫苗RCT相比更寬但重疊的間隔。1 2 7然而,由於我們在研究中觀察到的人群的差異,對這些疫苗的間接比較可能並不準確。首先,接種了Janssen疫苗的患者與mRNA患者有本質上的不同:平均而言,他們更年輕,黑人患者的比例更高,並有更多的共病。因此,Janssen和mRNA疫苗的比較有效性研究需要大規模傾向匹配等穩健的技術來確保有效的比較。其次,雖然Moderna和Pfizer患者的基線特征相似,但CUIMC數據中疫苗接種的時間分布不同。Moderna疫苗在2021年早期接種,高峰在1月,而輝瑞疫苗在4月達到高峰。鑒於COVID-19流行率的基線不同,mRNA疫苗的比較需要按日曆月匹配患者,以解釋這種潛在的偏差。這些疫苗在我們的係統中也有不同的給藥途徑。與輝瑞疫苗不同的是,Moderna疫苗是在其他地方接種的,並對積極觀察的患者進行記錄。輝瑞疫苗是在CUIMC/紐約長老會中心對所有患者進行長期注射。這類患者更有可能在我們的醫療體係之外接受檢測或治療。
限製
由於研究的觀察性質,數據源可能無法完全捕捉到患者的情況,因為患者可能在醫院係統之外尋求治療。雖然我們的結果表型算法可能會受到測量誤差的影響,但我們提供了其他結果定義的額外分析。通過在CUIMC/紐約長老會站點提供免費和可用的COVID-19檢測和COVID-19疫苗接種,以及從紐約市和州免疫登記處獲取數據,緩解了暴露錯誤分類。隨著檢測的可獲得性,通過在指標日期匹配暴露和未暴露組,並使用指標月份作為傾向得分模型的協變量,COVID-19基線感染率差異得以緩解。我們試圖通過在傾向評分模型中選擇大量的協變量,如就診次數、程序和藥物使用、既往疫苗行為、種族和其他,來解決接觸和未接觸群體之間的潛在差異。然而,我們沒有關於社會交往、遵守預防措施和政策的數據,而這些可能會影響COVID-19感染和檢測的可能性。
研究結果可能無法推廣到具有不同疫苗管理做法和政策的其他國家或環境。最後,研究期間不允許我們根據COVID-19變體對結果進行分層,這限製了研究結果對其他變體的普遍性。
結論
如果考慮到暴露和結果分類錯誤等潛在偏差,並選擇適當的錨定事件,觀察數據可用於確定疫苗的有效性。在分析疫苗有效性時,研究人員需要仔細檢查數據,以確保比較組表現出相似的健康尋求行為,並且同樣有可能在數據中被捕獲並報告其發現。特別是對於COVID-19疫苗,在未接種疫苗的患者中,任意日期作為指標日期比醫療保健遇到的情況更符合接種的反事實。疫苗接種後第一周內的有效性應報告,即使疫苗接種後即刻的有效性低或高並不會使研究結果無效。鑒於疫苗接觸的時間趨勢和基線特征的差異,有必要對疫苗進行大規模直接比較,以檢查比較效果。
數據可用性聲明
所有與研究相關的數據都包含在文章中或作為補充信息上傳。由於當地的信息治理和數據保護法規,在沒有得到數據管理員批準的情況下,不能共享患者級數據。
倫理語句
病人同意發表
倫理批準
這項研究的方案得到了哥倫比亞大學機構審查委員會(AAAO7805)的批準。該研究使用了識別數據。
致謝
我們要感謝新澤西州Titusville Janssen研發公司的員工Patrick Ryan,感謝他對這項研究給出的深思熟慮的反饋。
參考文獻
補充材料
-
補充數據
這個網絡僅文件已由BMJ出版集團從作者提供的電子文件生產(s),並沒有編輯的內容。
腳注
貢獻者GH設計並監督了這項研究,並擔任擔保人。AO執行了這項研究,解釋了結果並起草了手稿。GH和AO審核了手稿,批準了最終版本,並對提交出版的決定負有最終責任。
資金美國國家醫學圖書館(R01 LM006910),美國食品和藥物管理局CBER BEST計劃(75F40120D00039)。
相互競爭的利益GH和AO獲得了美國國立衛生研究院(NIH)和美國食品和藥物管理局的資助。
患者和公眾的參與患者和/或公眾未參與本研究的設計、實施、報告或傳播計劃。
來源和同行評審不是委托;外部同行評議。
補充材料本內容由作者提供。它沒有經過BMJ出版集團有限公司(BMJ)的審查,也可能沒有經過同行評審。討論的任何意見或建議僅僅是那些作者(s)和不被BMJ認可。BMJ放棄從放在內容上的任何依賴產生的所有責任和責任。如果內容包含任何翻譯材料,BMJ不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南、術語、藥品名稱和藥物劑量),並且不對翻譯和改編或其他原因引起的任何錯誤和/或遺漏負責。