條文本
摘要
目標建立COVID-19疾病分層模型,根據患者住院期間的病情變化進行更新,以方便患者管理和資源配置。
設計在這項回顧性隊列研究中,我們采用了一種裏程碑式的方法來動態預測未來48小時內的全因住院死亡率。我們解釋了信息預測缺失和選擇預測使用懲罰回歸。
設置本研究中使用的所有數據都來自英國的一家教學醫院。
參與者我們利用2020年3月1日至2020年9月12日期間在英國一家醫院就診的473名連續COVID-19患者開發了該模型;並使用2020年9月13日至2021年3月17日就診的1119名患者的數據進行了時間驗證。
主要和次要結果測量主要結果是預測時間48小時內的全因住院死亡率。我們考慮了活著出院和轉移到三級重症監護室進行體外膜氧合的競爭風險。
結果我們的最終模型包括年齡、臨床虛弱量表評分、心率、呼吸頻率、氧飽和度/分數氧比、白細胞計數、酸中毒(pH <7.35)和白細胞介素-6。內部驗證獲得了0.90 (95% CI 0.87至0.93)和0.86 (95% CI 0.83至0.88)的受試者工作特征(AUROC)下的麵積。
結論我們的模型結合了靜態風險因素(如年齡)和不斷變化的臨床和實驗室數據,以提供一個動態風險預測模型,適應個體患者臨床狀況的突然和逐步變化。在成功的外部驗證,該模型有潛力成為一個強大的臨床風險評估工具。
試驗注冊該研究已在研究注冊處注冊為“researchregistry5464”(www.researchregistry.com).
- 新型冠狀病毒肺炎
- 流行病學
- 風險管理
- 統計與研究方法
數據可用性聲明
數據可能從第三方獲得,但不公開。支持本研究發現的識別數據可從劍橋大學醫院獲得,但這些數據的可用性受到限製,這些數據是在當前研究的許可下使用的,因此不能公開獲得。然而,在劍橋大學醫院的允許下,數據可從作者的合理請求中獲得。
這是一篇開放獲取的文章,按照創作共用署名非商業性(CC BY-NC 4.0)許可發布,該許可允許其他人以非商業性的方式發布、混編、改編、構建本作品,並以不同的條款授權他們的衍生作品,前提是原創作品被正確引用,給予適當的榮譽,任何更改都被注明,且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/.
來自Altmetric.com的統計
本研究的優勢和局限性
我們的動態預測模型可以合並患者數據,因為它在整個醫院訪問中積累。
我們使用已建立的統計標記方法進行動態預測;我們考慮了院內死亡率主要結局的競爭性風險,以及臨床和實驗室數據的潛在信息可用性。
由於劍橋郡的發病率較低,第一波嚴重COVID-19入院患者的樣本量相對較低,但在2020/2021年冬季的幾個月顯著增加,為臨時驗證模型提供了機會。
作為單中心研究,提出的模型將需要外部驗證來評估其在其他隊列中的性能;如果新變種的特性或其管理有重大變化。
我們的工作還強調了統計標記框架的適應性,該框架可用於使用經常收集的醫院數據建模個別患者的結果。
簡介
SARS-CoV-2病毒感染是COVID-19的病因,會導致一係列疾病,從無症狀感染到需要重症監護甚至死亡的威脅生命的疾病。對於入院的患者,必須確定哪些人有惡化和死亡的風險,以便及時進行有針對性的幹預(如免疫調節和機械通氣),促進適當的資源分配和患者流動,並為與患者和家屬的討論提供信息。
大多數現有的COVID-19疾病嚴重程度預測模型僅使用入院時可用的數據。這種入院點模型已被提出用於死亡率和綜合升級/死亡率結果,包括新的和重新使用的嚴重程度和早期預警評分1 - 7和比較模型。8日至13日
雖然某些嚴重程度的標誌,如性別和年齡,在住院期間可以假定不變,但其他的標誌,如臨床觀察和血液測試結果,在住院期間可能發生顯著變化。COVID-19是一種動態疾病,患者可能在短時間內惡化或出現急性並發症,例如血栓栓塞。14日15這可能對患者的預後有顯著的影響,這是無法通過入院點模型預測的。
一個能夠在任意時間點通過包括更新的患者信息來調整預測的模型可以極大地幫助臨床決策。與入院點模型相比,吸收臨床數據積累的動態模型可能對患者的臨床過程和隨後幾天的預後提供更準確和臨床有用的預測。包含入院後信息的預測模型在數量和範圍上都是有限的。一些預測死亡率或病情惡化的模型在入院後使用了信息,但在入院後的最初幾天內就不能繼續使用。16日17更近期的時變Cox模型(死亡率和升級)18 19和機器學習模型(死亡率)20.使用了額外的入院後數據。然而,時變Cox模型不應該用於預測,因為它們需要來自未來的臨床信息的知識來計算危險函數,這在實踐中是不可能的。21此外,雖然這些模型顯示了有希望的鑒別,但它們使用了臨床不合理或不明確的方法來處理缺失的數據和審查,並且沒有解釋信息缺失或考慮治療的效果。信息性缺失描述了這樣一個事實:在例行收集的數據中,一個結果或觀察的可用性(或缺失性)可能與結果的概率有關。例如,可能會派出更廣泛的調查小組,調查那些被認為更有可能從護理升級中受益的患者,比如轉到重症監護室(ICU)。雖然經常被忽視,但這種影響在電子健康記錄(EHR)數據中可能很強。22日23日
我們利用常規收集的臨床數據,基於對隨後48小時內死亡率的預測,提出了COVID-19醫院患者的預後風險分層評分。我們的模型是基於一種叫做標記的原則性統計方法21日24日25日這使得在預測時間之前記錄的任何隨時間變化的臨床參數都可以被包括在內,同時適當地考慮到風險患者組的審查和變化。該模型考慮了信息缺失和相互競爭的風險,當出現兩種或兩種以上相互排斥的結果時,例如,一旦患者出院,(住院期間)住院死亡的風險就被消除了。因此,放電是一種“競爭風險”26從住院死亡率的角度來看。我們使用最近提出的方法在地標框架內考慮競爭風險27以前沒有使用頻繁收集的EHR數據來建模單個患者的結果。
材料和方法
研究設計
這是一項回顧性隊列研究,涉及2020年3月1日至2021年3月17日期間在劍橋大學醫院(位於英格蘭東部的一所地區性三級護理大學醫院)就診的所有患者。該醫院是其直接流域的COVID-19患者的唯一入院醫院,也是廣泛專科服務的區域轉診中心,不包括體外膜氧合(ECMO)。
我們根據個人預後或診斷報告指南的多變量預測模型的透明報告報告我們的發現。28
研究人群
所有在研究期間住院並診斷為COVID-19的成人(≥18歲)均納入研究範圍。診斷基於就診期間或就診前14天內SARS-CoV-2診斷陽性,或COVID-19臨床診斷(在線補充附錄1).臨床診斷為COVID-19的患者(根據症狀和治療臨床醫生的臨床意見)被包括在內,因為在大流行的早期階段診斷檢測有限。29
我們隻包括涉及(或隨後)第一次檢測陽性的每個患者的第一次醫院就診;任何重新入院都被排除在外。醫院感染定義為入院後10天以上首次出現SARS-CoV-2檢測陽性或診斷陽性。由於我們第一次在6小時內訓練我們的模型(以便有時間進行實驗室調查),因此在送往醫院6小時內死亡、出院或被分類為生命結束的患者被排除在外。
所有患者均按照當時醫院詳細的當地使用指南進行治療。患者亦有資格參加研究期間在醫院進行的相關臨床試驗(在線補充附錄2).
結果
在每位患者的住院期間,我們的目標是預測未來48小時內的全因住院死亡率,我們將這段時間稱為“預測範圍”。我們還考慮了兩個競爭風險:轉到三級ICU進行ECMO;因臨床改善而出院隨訪至2021年3月19日。
患者和公眾的參與
本研究設計無患者參與。
模型開發
59個候選臨床參數列表(在線補充表1)是根據現有的COVID-19入院點預測模型選擇的;更廣泛地預測危重疾病死亡率的評分組成部分,如順序器官衰竭評估30.急性生理和慢性健康評估231;以及其他可能的預測因素的臨床意見。這些指標分為五類:人口統計、共病、觀察、實驗室檢測和治療、幹預措施和護理水平。
從醫院電子病曆中提取基本患者人口統計數據:入院時的性別、種族和年齡;以及偏離標準體重指數範圍,使用最近的測量(直到1歲)。
此前與COVID-19嚴重程度相關的12種共病32在做出預測之前(就診之前或就診期間),通過在電子病曆中輸入相應的ICD-10代碼進行識別。在線補充表2提供用於定義每種共病的ICD-10編碼。除了特定的共病外,65歲以上患者的虛弱通過臨床虛弱量表(CFS)評分進行評估33(在線補充附錄3).
我們納入了EHR中定期記錄的以下觀察數據:心率(HR)、平均動脈壓、溫度和呼吸頻率(RR)。計算氧飽和度(SpO2)/分數激發氧(FiO2)比值(其中SpO2和FiO2在同一時間點可用),以指示缺氧的嚴重程度。34 35SpO2本身並沒有作為一個潛在的預測因素,因為我們的探索工作表明,在不考慮FiO2的情況下,這在很大程度上反映了患者指定的氧飽和度指標,因此,它可以作為潛在呼吸道疾病的代理指標(例如,慢性阻塞性肺疾病患者被指定較低的SpO2指標)。當隻有氧氣流速時,FiO2根據EPIC II轉換表估計。36同時測定PaO2/FiO2 (P/F)比值。我們總結了過去24小時的測量數據:平均值、最小值和最大值。我們還計算了“趨勢中值”,即過去24小時的中值與此前24小時的中值之間的差值。從電子病曆中提取格拉斯哥昏迷評分(GCS);無GCS記錄的患者假定GCS≥12。
對於31個實驗室測試中的每一個,我們都考慮(在線補充表1),我們包括了預測時間前48小時的結果。當有多個結果可用時,我們使用最新的結果。此外,對於7項最常用的血液檢測(C反應蛋白(CRP)、白細胞計數(WCC)、血小板、血紅蛋白、肌酐、鈉、鉀),我們納入了中位數趨勢。中性粒細胞/淋巴細胞和白細胞介素-6/白細胞介素-10(血清IL-6/IL-10)的比值以前被認為是預後指標,因此我們也認為它們是潛在的預測指標。9 17 37對於異常低和異常高的結果可能與不良預後相關的血液標記物(鈉和pH),我們包括了前24小時內低於和高於正常範圍的最大偏差。我們通過添加0.03來調整靜脈pH值結果以接近動脈pH值結果。38
我們納入了治療、幹預和護理水平的五個指標。根據患者在過去24小時內是否住過ICU病床來總結患者的護理水平。機械通氣被定義為在過去24小時內接受有創通氣的患者,可通過氣管內管或氣管造口術。在過去24小時內使用的腎髒替代療法是從EHR中確定的。心血管支持定義為在過去24小時內服用任何抗利尿藥物或收縮性藥物。類固醇治療已被證明可以降低COVID-19患者的28天死亡率。39 40因此,我們納入了一個指標,即在做出預測之前,患者在住院期間是否接受過治療劑量類固醇(定義為每天6 mg地塞米鬆或同等劑量的強的鬆、氫化可的鬆或甲基強的鬆龍)。
模型
我們采用了一種裏程碑式的方法,27用於動態預測。21日24日25日以24小時為間隔(稱為“地標時間”),我們訓練時間-事件模型,使用地標時間之前(或)記錄的臨床參數作為預測因子。這使得將反複測量的臨床參數納入預測模型成為可能,這樣,預測指標就可以反映患者軌跡的任何變化,同時適當考慮到風險人群的審查和變化。如果主要結果記錄在一個裏程碑時間的預測範圍內,則記錄從裏程碑到事件的相對時間內的結果;預測視界之後的事件被刪減。在標記時間之前發生過任何事件的患者被排除在外,因為這些患者不再有風險。第一個裏程碑是在出現症狀後6小時,以便有時間積累臨床信息,或在醫院患者確診COVID-19時(在出現症狀後10天或更長時間確診)。我們隻使用了在該時間點接受積極治療的COVID-19患者的每個標誌性時間點的數據:忽略了過渡到生命護理結束後的標誌性時間點,這意味著在這些時間點沒有做出預測,盡管在現有預測範圍內發生的事件仍然包括在內。接受生命終末期護理的患者通過電子病曆中記錄的病情升級狀態進行識別,並通過手工審閱包含相關關鍵詞的患者記錄(在線補充附錄4).我們使用了一種超級模型方法,其中時間到事件模型假設在地標時間上是恒定的。39
具體來說,我們使用了競爭風險標記方法27 41該模型使用細灰色競爭風險模型預測住院死亡,並考慮ECMO出院和轉院的競爭風險。42 43Fine-Gray模型利用與累積關聯函數直接相關的子分布危險度,估計感興趣事件發生的概率。Cox模型使用的原因-特定危害函數更適合於推斷生物機製,而基於子分布的危害模型更適合於預測。44
缺失值
我們使用缺失指標方法處理缺失數據,因為EHR中臨床參數的記錄,無論值如何,通常都表明了治療衛生專業人員對患者病情的同時代看法。45 46從概念上說,我們的方法,以及估計一個特定臨床參數單位增加的“效果”(這是所有回歸方法的標準),估計一個變量“缺失”的“效果”。由於沒有測量或EHR中沒有記錄,一個臨床參數可能“缺失”(也稱為“未記錄”或“不可用”)。對於模型中的每個潛在預測因子,我們還包括一個缺失指標,這表明在相應的時間段內沒有記錄數據。這種方法允許將記錄不完整的臨床參數包括在我們的模型中,並避免了不太可能在這些數據中保持隨機缺失(MAR)假設的需要。47對於每個參數,最終使用兩個表達式中的一個來預測每個時間點上的每個患者:要麼是記錄時描述與臨床參數關係的係數,要麼是缺少臨床參數時的固定值。
如果最近一次測量是在裏程碑時間前48小時以上采集的,則認為血液檢測缺失。當在過去48小時內重複血液測試時,使用最近的結果。我們考慮的生命體征在任何包含的地標上都沒有缺失值。
預測的選擇
為了選擇模型中最具預測性的參數,我們采用了一種針對細灰色模型提出的方法48它使用標準懲罰變量選擇,特別是平滑裁剪絕對偏差(SCAD),並選擇調優參數以使貝葉斯信息準則最小化。我們使用組SCAD將參數與其對應的缺失指示符配對,以防止包含沒有缺失指示符的不完整記錄的參數49;但也允許缺失指標單獨包含在內。
在R V.3.6中進行了模型的開發和驗證。50
模型評估
采用受試者工作特征曲線下麵積(AUROC)對鑒別進行定量評價,0.5表示無鑒別,1.0表示完全鑒別。為了驗證模型在訓練數據上的性能,除了未經調整的AUROC外,我們還進行了重複的五次交叉驗證(分成80%的訓練,20%的驗證數據),以考慮由於完整的模型構建過程(包括變量選擇)而導致的不確定性和過度樂觀。51我們還計算了精確回憶曲線(PR)和精確回憶曲線下麵積(AUPRC),因為當主要結果發生率較低時,它比AUROC提供了更清晰的性能總結,如這裏。52我們通過需要評估的數量(NNE)對敏感性進行可視化評估,定義為1/陽性預測值(1/PPV)。我們還計算了淨收益曲線。53
我們使用預測風險與觀察死亡率的校準圖進行可視化校準。我們還定量評估了標定斜率和標定量。54
敏感性分析
為了評估模型是否受到長期住院患者的過度影響,我們僅使用每個患者的前28個地標時間(跨度28天)重新訓練模型。我們還根據COVID-19是否通過SARS-CoV-2診斷檢測陽性確診,以及患者在入院前是否至少接種過一劑COVID-19疫苗(牛津-阿斯利康、輝瑞- bioontech Comirnaty或Moderna Spikevax),對模型評估的敏感性進行了評估。我們還評估了如果我們刪除所有實驗室測試的模型的區別性。最後,我們探討了用72小時預測地平線取代24小時預測地平線的影響。
結果
預測模型的發展
我們使用第一波(2020年3月1日至2020年9月12日)的數據開發了該模型,之所以選擇結束日期,是因為在這一天隻有一名COVID-19患者仍在醫院。在第一波期間,共有519名COVID-19患者入院,其中46人因在第一個標誌性時間(即就診後6小時內)之前出院(34人)、死亡(2人)或轉入臨終護理(10人)而被排除在外。模型開發中包括的473名患者的特征顯示在表1.
我們總共包括6846個用於訓練模型的標記次數,每個患者的標記次數中位數為9 (IQR 3-17)。在這些標誌性時間之後的48小時預測範圍內,發生了119起住院死亡事件(占標誌性事件的1.7%),658起出院事件(9.6%)和10起ECMO轉院(0.1%)。注意,由於地標每24小時發生一次,而預測時間是48小時,患者事件通常會在兩個相鄰地標時間的預測時間範圍內發生。在線補充表1報告概要統計數據,缺失和每個預測器的每個地標時間可用的測量數量。無患者因數據缺失而被排除。
模型結果
我們建議的模型(表2和在線補充表3)的48小時住院死亡率包括年齡、CFS評分、55HR, RR, SpO2/FiO2比值,34 35WCC、酸中毒(pH <7.35)和白細胞介素-6 (IL-6)。死亡率可以用計算器計算http://shiny.mrc-bsu.cam.ac.uk/apps/covid19mortalityrisk/;看到在線補充附錄5獲取詳細信息。
內部性能評估
圖1中的模型的內部性能度量表2(使用訓練數據)。受試者工作特征曲線下未調整的內部麵積(AUROC)為0.90 (95% CI 0.87至0.93),交叉驗證AUROC中位數為0.87,均表明具有良好的識別力(圖1一個).PR曲線(圖1 b在48小時住院死亡率為0.017(1.7%)的人群中AUPRC為0.31,我們觀察到敏感性小於0.75的NNE <10 (圖1 c).圖1 d顯示校準圖。校準截距為−0.02 (95% CI−0.22至0.17),表明平均預測概率與平均觀察死亡率相匹配,而校準斜率為1.16 (95% CI 1.02至1.31),表明高預測風險患者的觀察死亡率略高於預測死亡風險,盡管CI範圍較寬。提出的模型對風險分層的淨收益曲線明顯高於將所有人或無人分類為高風險患者的兩種非模型替代方案,表明動態模型的臨床效用(在線補充圖1).
預測模型的時間驗證
我們通過將該模型應用於第二波招生(2020年9月13日和2021年3月17日)期間的持有數據,評估了該模型的性能。在此期間,共有1119名患者就診於研究醫院。總的來說,我們使用了12 981個標記次數來測試模型,每個患者的中位數為6(2-14)個標記次數。在這些標誌性時間之後的48小時預測範圍內,發生了253起住院死亡事件(占標誌性事件的1.9%),1615起出院事件(12.4%)和2起ECMO轉院(0.015%)。由於缺少生命體征數據,遺漏了47個地標時間。特點總結在表1.值得注意的是,與第一波相比,第二波出現的患者略年輕,更可能是女性,這是一個更平衡的數據集證明的。
圖2顯示時間驗證性能指標,通過應用訓練過的模型(表2)到第二波病人。受試者工作特征(ROC)曲線(圖2一個)表明該模型繼續具有良好的鑒別能力,AUROC為0.86 (95% CI 0.83 ~ 0.88)。PR曲線(圖2 b)顯示,在所有敏感性的第2波隊列中,PPV始終遠高於48小時住院死亡率0.019(1.9%)。AUPRC 0.15降低,NNE高於訓練數據,盡管在0.02到0.63 (圖2 c).圖2 d如圖所示為校正圖,顯示模型在高風險患者中有低估風險的趨勢:大規模校正為0.35 (95% CI 0.21 ~ 0.47),表明預測概率的平均值低於平均觀察死亡率,校正斜率為0.90 (95% CI 0.82 ~ 0.99),表明預測風險的擴散明顯小於觀察死亡率的擴散。校正圖顯示,低危患者的觀察死亡率和預測死亡風險之間具有良好的對應關係(<0.4),但由於各標誌間死亡事件發生率較低,對高危患者的對應關係較差。大量的ci證明了這一點。提出的模型的淨收益曲線超過了將所有人和不將任何人歸類為高危患者的兩種選擇(在線補充圖2).
敏感性分析
模型訓練的數據僅來自前28個標誌的每個患者非常相似的模型表2雖然臨床虛弱評分和IL-6未被選擇(在線補充表4).
我們沒有發現有證據表明模型的區別受到是否有陽性的SARS-CoV-2診斷結果(而不僅僅是一個臨床診斷)的影響。在SARS-CoV-2檢測陽性的患者中,訓練數據集的AUROC為0.90 (95% CI 0.87至0.93),驗證數據集的AUROC為0.85 (95% CI 0.83至0.88);而對於隻有臨床診斷的患者,訓練數據集的AUROC為0.94 (95% CI 0.88至1.00),驗證數據集的AUROC為0.88 (95% CI 0.79至0.99)。
在我們的驗證數據集中,有一小部分患者(65例患者,可獲得874個標記)在分析時接種了COVID-19疫苗:這些患者的AUROC為0.88 (95% CI 0.71至0.99),表明具有良好的識別力,並與未接種疫苗的患者(AUROC 0.85 (95% CI 0.83至0.88)一致。
為了評估一個更簡單的模型是否可以執行類似的操作,我們考慮從我們的模型中刪除實驗室測試(在線補充表5和6).結果模型提供了稍差的辨別能力,在訓練數據中AUROC為0.88 (95% CI 0.85到0.90),在驗證數據中AUROC為0.85 (95% CI 0.82到0.87)。
為了評估CRP在我們的模型中是否可以作為IL-6的替代物,我們用CRP來代替IL-6 (在線補充表7和8).AUROC在訓練數據(0.89,95% CI 0.85 ~ 0.93)和驗證數據(0.84,95% CI 0.81 ~ 0.87)中都略低。
為了評估我們的方法在延長時間範圍內的可行性和所選預測因子的穩定性,我們用72小時預測範圍改裝了模型。所得模型與訓練數據中0.90的AUROC和驗證數據集中0.85的AUROC相匹配。完整的性能指標可在在線補充圖3和4,模型係數為在線補充表9.
討論
SARS-CoV-2會引起廣泛的疾病,隨著時間的推移可能會演變,可能需要重症監護管理,甚至導致死亡。鑒於新的冠狀病毒感染浪潮的威脅,臨床仍然迫切需要能夠預測疾病的嚴重程度和疾病軌跡,以促進患者管理和資源分配。本文描述的模型結合了靜態的入院風險因素(年齡和CFS)和不斷變化的臨床和實驗室數據,提供了一個動態的48小時風險預測模型,可以適應個體患者臨床狀況的突然和逐步變化。模型中使用的數據是在患者住院期間定期收集的人口統計學和臨床數據,自動從患者EHRs中提取。因此,該模型可以很容易地納入常規臨床護理。
自大流行開始以來,針對各種終點和時間範圍開發了大量關於COVID-19風險分層模型的文獻,盡管在一項大型係統綜述中,許多文獻被描述為不可靠56並保持用戶搜索。大多數文獻都考慮了入院點評分,包括4C死亡率評分,57這是基於人口統計信息,共病和入院時的血液測試。該評分在大型開發和驗證隊列中都表現良好(AUROC分別為0.77和0.79),現在已經在幾個國家進行了外部驗證。58 - 64同樣,入院點ISARIC 4C惡化評分3.已經過外部驗證。58 60 65 66最近也有人提出了有前途的機器學習替代方案,67 68盡管與4C評分相比,這些還沒有得到獨立驗證。另一種方法是重新利用現有的預警評分,特別是國家預警評分(NEWS) 2評分。69NEWS2在預測14天惡化(轉到ICU或死亡的綜合結果)方麵的鑒別性被描述為中等1 64(AUROC 0.70),而對於24小時臨床惡化(開始呼吸支持或死亡)則被描述為合理(AUROC 0.78)。64年齡和其他生理參數和血液測試的添加導致識別率的提高(AUROC 0.735和0.78)。3.NEWS2是大多數英國醫院升級路徑的核心組成部分,國家建議NEWS2評分為7分或以上的患者應由重症監護組複查。NEWS2在一定程度上可以預測重症監護住院人數,這一點並不令人驚訝。
使用COVID-19患者入院後動態數據進行風險預測的文獻要少得多。一些模型隻使用了入學前幾天的數據。70年16日17日其他人則在時變Cox模型中使用了額外的入院後數據(死亡率和病情升級),18 19這需要未來的臨床信息所以不應該用於預測。21死亡率的機器學習模型20.和呼吸支持71也有報道稱具有良好的辨別能力,盡管缺失的數據要麼被丟棄,要麼被歸因,這忽略了信息缺失的問題,並可能限製其在個別患者水平上的適用性。它們也沒有考慮到競爭風險,例如出院。當這篇論文被審查時,一個有前途的基於隨機森林的動態模型被提出,預測呼吸支持的需要(包括高流量鼻氧,有創和無創通氣)和死亡。72該模型報告了較高的內部差異(AUROC 0.89, 95% CI 0.88 - 0.90),但未報告PR。在該模型中確定的最重要的預測因子是SpO2/FiO2比值和RR,這兩者也在我們的模型中具有特點。這兩項觀察結果在決定增加呼吸支持水平方麵發揮了重要作用,因此尚不清楚該模型在1天範圍內是否提供了很多臨床上尚未明顯的預測(在已經做出決定後預測額外呼吸支持的需求作用不大)。此外,模型如何處理丟失的數據也不清楚。馬爾可夫模型也被提出,它尋求為患者的軌跡建模,而不是像我們在本文中所做的那樣專注於預測。73 74
我們的方法有幾個方法上的優勢,我們認為這使它有別於以前的模型。首先,我們考慮了競爭風險,因此利益結果(風險)(在本例中是院內死亡)隻能在患者住院期間發生,因此利益結果與轉移到另一家醫院和/或出院的風險“競爭”。這一點在預測建模中是很重要的。75其次,我們考慮到觀察和調查的可用性本身可能反映疾病嚴重程度的可能性,因為在特定時間要求進行特定測試的事實可以洞察治療的臨床醫生對患者病情的同時代觀點。雖然在臨床預測模型中經常使用多重imputation,因為它在MAR假設下給出無偏估計,但在我們使用的常規收集的EHR數據中,這種假設不太可能成立。45我們采用的缺失指標方法不依賴於MAR假設,可以提高電子病曆數據的預測性能。45-47此外,我們使用來自不同波浪的數據驗證了我們的模型。由於每一波包括不同傳染性的COVID-19變體,它們可能與不同的發病率和死亡風險相關,因此模型在不同波間表現合理(敏感性介於0.02至0.63之間的NNE <10)的事實進一步證明了我們所選參數對不同臨床場景的預測是有用的。最後,在臨床醫生確定患者進入生命的最後幾個小時或幾天後,我們不尋求對患者進行預後預測。由於觀察和調查往往在生命結束時中斷,包括這些時間段將會由於極度缺失而扭曲模型(在我們的數據中,在臨終關懷期間43%的天沒有記錄生命體征觀察,而在積極治療期間為0%)。此外,在臨床表現明顯後預測壽命結束將沒有什麼臨床效用。
在我們的模型中包括的幾種疾病嚴重程度的預測因素也已通過入院點嚴重程度模型和嚴重疾病風險因素的流行病學研究確定。人們普遍認為,年齡增長是COVID-19預後不良的最有力預測因素。3 11 32同樣,虛弱也被證明是住院的老年人死亡率的一個強有力的獨立預測因子,76包括COVID-19患者。77年55
呼吸損害是入院的常見原因,也是呼吸功能的標誌,包括RR,3 4 12動脈血氧飽和度,3.氧氣的需求3.和SpO2/FiO2比值已納入以往的入院點模型。我們的模型所選擇的SpO2/FiO2比值允許對額外氧需求進行完全定量而不是二分法的測量,也允許不同患者組中目標氧飽和度變化的混雜效應。
酸中毒常常使呼吸、腎髒和晚期循環衰竭複雜化,以前被認為是COVID-19疾病嚴重程度的一個標誌。78將酸中毒和堿中毒的嚴重程度單獨納入我們的候選預測因子中,可以考慮並避免pH值在任何一個方向上的變化,例如,堿中毒的輕微負麵影響掩蓋了酸中毒更嚴重的影響。
我們的模型選擇了兩個感染和炎症的標記物:WCC和IL-6。這與其他發現是一致的。11 79 80IL-6被納入了研究醫院的COVID-19常規血液檢測小組,但我們認識到,在其他醫院可能不太常見。當用CRP代替IL-6重建模型時,結果產生了一個稍弱但可能更廣泛適用的模型。IL-6優於CRP的模型可能反映了IL-6負責CRP的產生,因此,它是炎症反應的早期和更動態的標記物。81
我們的研究有幾個局限性。我們選擇隻包括48小時內的實驗室結果和地標時間前24小時內的生命體征;利用舊數據可能會提高我們模型的預測能力,但代價是複雜性和現實世界的實用性。我們的數據是從一個中心收集的,因此,我們的研究結果是否可推廣到其他中心和人群還有待外部驗證。此外,由於該醫院集水區人群中COVID-19患者的患病率相對較低,特別是在大流行的最初幾個月,因此我們的模型是在相對較小的樣本量中生成的。使用來自大型三級醫院的單一數據集的一個優點是,該醫院從未因患者過多而不堪重負,因此,它認為患者接受的治療是根據臨床認為適當的情況,而不是根據資源允許的情況。最後,雖然該模型在第二波驗證數據中繼續表現良好是令人鼓舞的,但患者臨床護理的變化(特別是類固醇和IL-6抑製劑的使用)和主要病毒株(包括本手稿在審查期間在英國出現的Delta和Omicron變種)可能會影響疾病的臨床情況、其嚴重程度和疾病的危險因素。因此,隨著大流行的演變,該模型可能需要更新,但利用該模型中的常規可用數據使這一點變得簡單。
數據可用性聲明
數據可能從第三方獲得,但不公開。支持本研究發現的識別數據可從劍橋大學醫院獲得,但這些數據的可用性受到限製,這些數據是在當前研究的許可下使用的,因此不能公開獲得。然而,在劍橋大學醫院的允許下,數據可從作者的合理請求中獲得。
倫理語句
病人同意發表
倫理批準
該研究獲得了英國衛生研究管理局倫理委員會的批準(20/WM/0125)。患者同意被放棄,因為這裏提出的去識別數據是在日常臨床實踐中收集的;沒有對知情同意的要求。
致謝
我們感謝Christopher Osuafor, Catriona Davidson, Alistair Mackett, Marie Goujon和Lelane Van Der Poel對虛弱子研究的協助。
參考文獻
補充材料
-
補充數據
這個網絡僅文件已由BMJ出版集團從作者提供的電子文件生產(s),並沒有編輯的內容。
腳注
貢獻者構思:JP、RJBG、SLC、EG-K、CSW和MW構思研究項目並設計研究。數據收集:VT, MW, SLC和RJBG提取和策劃數據集。VLK和DJH收集數據。分析工具和數據解釋:MW, RJBG和BDMT對分析工具的選擇和創建進行了分析和貢獻。JP、CW、EG-K、DJH、VLK和BDMT對數據和結果進行了解釋。實現:MW和RJBG對提出的方法進行了實現和分析。撰寫初稿:MW, CSW, EG-K, SLC和RJBG撰寫初稿。所有作者都對文章的重要知識內容進行了實質性的修改。所有作者都同意出版本腳本的最終版本,並對所呈現的工作負責。MW是該項目的擔保人。
資金MW由國家衛生研究所劍橋生物醫學研究中心(BRC-1215-20014)資助。VLK由MRC/NIHR臨床學術研究合作基金(CARP)資助(資助代碼MR/T023902/1)。VT由英國劍橋癌症研究中心資助。EG-K得到了NIHR臨床研究網絡(CRN)綠芽獎的支持。BT和RJBG得到UKRI醫學研究理事會(項目代碼MC_UU_00002/2)的資助,並得到國立衛生研究院劍橋生物醫學研究中心(BRC-1215-20014)的支持。
免責聲明資助方在研究的設計和實施中沒有任何作用;數據的收集、管理、分析和解釋;稿件的準備、審閱或批準;並決定投稿出版。本文僅代表作者個人觀點,不一定代表NHS、國家衛生條例、醫學委員會或衛生和社會福利部的觀點。
相互競爭的利益沒有宣布。
患者和公眾的參與患者和/或公眾未參與本研究的設計、實施、報告或傳播計劃。
來源和同行評審不是委托;外部同行評議。
作者注JP和RJBG是最後的作者。
補充材料本內容由作者提供。它沒有經過BMJ出版集團有限公司(BMJ)的審查,也可能沒有經過同行評審。討論的任何意見或建議僅僅是那些作者(s)和不被BMJ認可。BMJ放棄從放在內容上的任何依賴產生的所有責任和責任。如果內容包含任何翻譯材料,BMJ不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南、術語、藥品名稱和藥物劑量),並且不對翻譯和改編或其他原因引起的任何錯誤和/或遺漏負責。