條文本
文摘
目標有許多急性腎損傷(AKI)診斷模型的研究缺乏外部驗證和前瞻性驗證。我們構建了模型在48小時內使用三個數據庫預測嚴重的阿基在重症監護室(ICU)的病人。
設計一個回顧性和前瞻性群組研究。
設置我們研究危重病人在我們的數據庫(SHZJU-ICU)和兩個其他公共數據庫、重症監護的醫療信息集市(模擬)和AmsterdamUMC數據庫,包括基本的人口、生命體征和實驗室結果。我們預測診斷嚴重的阿基的病人在接下來的48小時內使用機器學習算法三個數據庫。然後,我們進行了實時嚴重阿基預測的前瞻性驗證研究中心1年。
參與者所有患者中包括三個數據庫和統一的排除標準。
主要和次要結果的措施效果評價指標的預測模型。
結果我們包括58 492例患者,共5257名(9.0%)患者遇到了嚴重的阿基的定義。SHZJU-ICU內部驗證和模擬數據庫,最好的接受者操作特征曲線下麵積為0.86 (AUROC)模型。通過AmsterdamUMC數據庫外部驗證結果也令人滿意,最好的AUROC 0.86。共有2532名患者被承認前瞻性驗證中心;358年積極的結果預測,344名患者被診斷出患有嚴重的阿基,最好的敏感性為0.72,特異性為0.80和0.84的AUROC。
結論嚴重阿基展覽承諾的預測模型作為臨床應用基於動態生命體征和實驗室結果與潛在的多中心數據庫和外部驗證。
- 急性腎功能衰竭
- 強化與急救護理
- 信息技術
- 成人密集和急救護理
數據可用性聲明
沒有數據是可用的。
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
來自Altmetric.com的統計
本研究的優點和局限性
前瞻性驗證機器學習的急性腎損傷的研究,而不是其他的研究。
三大數據庫包含不同國家人口和地區。
變量的抽樣監測頻率有限的臨床數據。
三個數據庫的樣本比例的差異。
變量的維度不夠豐富。
介紹
急性腎損傷),作為一種常見的臨床並發症在重症監護室(ICU),顯著增加了住院時間和死亡率。1阿基分為三種類型根據不同的目的:腎前的(腎灌注不足),intrarenal阻力指標病變也許可以(血管、腎小球或)和postrenal(尿路阻塞)。2雖然幾乎所有的疾病與入住ICU可能導致阿基有關,急性腎小管壞死,腎前的氮質血症是最常見的原因。3
所有AKI診斷標準包括最新的腎髒疾病:改善全球的結果(KDIGO)標準目前根據肌酐水平和尿量。4然而,肌酐水平的增加或減少尿量滯後阿基的發作。2許多研究表明,早期診斷和治療的可逆的阿基可以降低死亡率。5因此,肌酐水平和尿量不滿意滿足臨床診斷的要求。因此,許多研究人員試圖開發早期預警模型,分析AKI的風險因素。6
病人的並發症,如糖尿病、高血壓、心血管疾病、慢性肝病、膿毒症和創傷,被確定為阿基的重要危險因素。7阿基預測模型和基於高危因素評分係統開發已逐漸成為研究的重點考慮降低臨床應用閾值與新的生物標誌物。6盡管大多數先前的預測模型使用多個邏輯回歸模型,各種各樣的阿基預測模型基於機器學習導致了令人滿意的結果。6自第一阿基預測模型研究基於人工智能是出版於2016年,研究人員建立了20多個發表阿基預測模型先後通過使用本地或多中心數據庫。6 8 - 14結果表明,這些模型可以預測阿基的出現,需要腎髒替代治療(RRT)在24或48小時,精度從81%到97%。6日15此外,許多研究把重點放在了subspecialised條件,包括心髒手術、創傷和燒傷。14 - 16然而,在這些研究中常見的缺陷是缺乏外部驗證和前瞻性驗證,導致預測模型偏離臨床場景和限製外推範圍以外的數據。
在這項研究中,我們建立了模型預測阿基在48小時內使用橫貫大陸的三個數據庫危重病人。然後,我們評估的臨床效果的模型通過一年前瞻性驗證中心。
方法
研究的定義
在這項研究中,阿基的診斷證實是基於三個階段根據KDIGO標準。4我們定義了患者遇到了KDIGO AKI嚴重阿基II和III標準團體和其他消極組。我們排除了缺乏患者肌酐測量入學期間,患者肌酐基線超過3.0 mg / dL承認,遇到嚴重AKI診斷的患者在24小時內,和病人RRT入院後48小時內使用。19此外,我們排除了孕婦,14歲以下的患者,患者在ICU住院不到48小時。病人住進加護病房後,我們每24小時進行了預測和記錄預測時間。如果病人被診斷患有嚴重的安琪在48小時內,預測時間被定義為一個積極的預測點,和其他人被定義為一個消極點。
數據收集
變量包括人口數據、生命體征、基本和主要疾病,實驗室結果,重要操作記錄和藥物記錄。疾病包括高血壓、糖尿病、心髒病、肝髒疾病和惡性腫瘤。原發病的主要原因是錄取後的ICU icd - 10編碼。生命體征和臨床實驗室結果轉換成不同的變量根據平均方差、最大值、最小值和終值前診斷。我們使用的方法類似於遠期增量方法多元邏輯回歸模型,即結合嵌入式特征選擇的加入對特征選擇和前進。首先,所有的變量模型中被訓練,然後列出了變量的重要性。變量添加到模型中一個接一個地根據變量的重要性。變量是保留如果它使AUC增長大於0.01,否則刪除它。我們改變了模仿和AmsterdamUMC數據庫根據我們中心數據庫結構,統一的單位和診斷代碼。我們刪除變量缺失超過50%。 Variables missing more than 30% but less than 50% are listed to clinicians who determine the potential correlation between these variables and AKI. We carry out multiple interpolation for these variables which clinicians require to be retained, and the others deleted. Variables missing less than 30% are fill in multiple interpolation. All missing data between three databases and values included in the model shown in在線補充表S1。
模型建設和外部驗證
培訓和內部驗證集的比例是4:1。SHZJU和模擬數據庫的訓練集混合成新的訓練集。有更多的負麵數據比積極的數據,所以我們隨機取樣的負麵數據集和建造一個新的數據子集的抽樣比例1:5的正麵和負麵數據模型建立以提取變量的重要性。在隨後的模型驗證,我們采用原始數據集。我們使用多個邏輯回歸,隨機森林,XGBoost,演算法,LightGBoost,梯度提高決策樹(GBDT)和調試評估的變量和model-related參數5倍交叉驗證方法。模型建立後,我們使用了SHZJU-ICU和模擬測試集的內部驗證模型和外部驗證AmsterdamUMC數據庫。確定最合適的截止值根據鈷曲線。預測模型代表每個預測的結果與0和1.0之間的概率。我們定義結果超過0.4高風險,也就是說,積極的結果,其餘的負麵結果。通過內部驗證和外部驗證,我們校準模型通過調整super-parameters和使用普拉特校準算法,比較了通過可靠性圖校正效果。Python中的所有模型構建和驗證過程進行V.3.6。
未來的驗證
未來的研究是2020年1月1日- 2020年12月31日。我們收集實時數據,當ICU患者承認,改變了數據根據需求,形成一個完整的樣本的預測模型經過完整性測試。我們建立了一個可視化方案,允許研究人員每天檢查預測。每日預測結果不公開在研究過程中,以避免影響臨床醫生的決定,但診斷結果提供給研究者,視覺圖形。我們品嚐了每個月20%的預測數據,刪除與缺失值50%以上樣品,確保數據的正確性。當病人有以下條件,阿基預測係統將結束病人的前瞻性預測:(a)一個積極的診斷;(B)轉移與負加護病房或死亡的診斷。所有診斷嚴重的阿基需要由兩個獨立加護病房主治醫生,如果他們有不同的意見,第三個將提起上訴。
統計分析
人口特征被報道為傾斜的中位數和差數據和手段和SD為正態分布數據。獨立樣本t檢驗被用於正態分布數據,和rank-sum測試是用於休息。χ二分變量進行評估2測試和p值小於0.05被認為是具有統計學意義。非正態分布數據分析指數變換和對數變換。模型的效果評價等參數下的麵積接受者操作特征(AUROC)、準確性、特異性和F1-score。
病人和公眾參與
三個數據庫的信息情況下的狀態完成的脫敏過程中構建模型。在未來的研究中,所有的患者簽署知情同意書進入ICU的開始。隻有使用的實時數據討論和研究成員,在研究期間,並沒有公開。之前所有的數據是匿名作者訪問本研究的目的。因此,病人的優先級,經驗和偏好不會影響研究問題和結果的發展措施。如果有必要,我們將通過電話通知病人的相關研究成果。
結果
根據入選標準和排除標準,我們選擇58 492名患者來自三個數據庫遇到的需求研究,從SHZJU-ICU數據庫包括6461名患者,36歲的690名患者模擬數據庫和15 341名患者從AmsterdamUMC數據庫。共有5257名(9.0%)患者遇到了嚴重的阿基的定義(模仿SHZJU-ICU 11.8%, 7.6%和10.9% AmsterdamUMC)。年齡和性別分布的三個中心相似,但種族的差異很大。亞洲患者占99%以上在SHZJU-ICU數據庫中,隻有大約2.5%的模擬數據庫。白人占70%以上的模擬數據庫。此外,病人從模擬數據庫有一個腫瘤的發病率較高,肝硬化、糖尿病和高血壓。AmsterdamUMC和SHZJU-ICU數據庫中的患者有較高比例的機械通風和總體生存率。嚴重AKI患者ICU住院時間較長和更高的死亡率。給出更多細節表1。
有顯著差異的重要參數變量在不同的模型(見在線補充圖S1)。然而,肌酐水平的趨勢在過去一周仍是一個重要的變量,其次是尿液體積,血尿素氮水平,溫度和ICU停留的長度。截止值用於區分正麵和負麵的預測是由鈷曲線,與值為0.423在線補充圖S2)。GBDT模型測試集的預測效果最好,其次是XGBoost和LightGBoost。在兩個中心內部驗證集,兩個表現最好的機器學習算法與偉大的AUROC LightGBoost (SHZJU-ICU 83.2%,模仿的86.0%)和XGBoost (SHZJU-ICU 85.9%,模仿85.6%),詳細圖2。總的來說,靈敏度(SHZJU-ICU 0.84,模仿0.83)和陰性預測值(SHZJU-ICU 0.90,模仿0.90)的預測模型是高,但特異性通用(SHZJU-ICU 0.79,模仿0.75)所示表2。在外部驗證基於AmsterdamUMC數據庫中,整體效果模型驗證結果滿意,和XGBoost最佳性能,AUROC 0.84,如圖所示圖2和表2。
根據納入和排除標準,我們刪除267個病人中94例肌酐基線超過3.0 mg / dL承認,39名患者遇到嚴重AKI診斷患者在24小時內和26 RRT入院後48小時內使用,108名患者在ICU住院不到48小時。共有2532名患者承認我們的前瞻性驗證中心和16的預測模型預測的858倍。前瞻性群組,沒有顯著差異在年齡、性別、基線肌酐和尿素氮和並發症。機械通風和ICU停留時間的比例在AKI患者長更高的死亡率。最重要的是,沒有前瞻性和回顧性隊列之間的顯著差異。更多細節將在年代在線補充表S2。最後,358年積極的結果預測,剩下的負麵結果。有344例嚴重AKI患者診斷和預測精度為83.5%。最高的模型曲線下的麵積是XGBoost, 0.84最好的敏感性為0.72,特異性為0.80。前瞻性研究的結果類似於模型的外部驗證,並相對穩定。詳細介紹了圖3和表2。
討論
在這項研究中,我們通過機器學習建立預測模型來預測嚴重阿基三個數據庫的發病率在不同地區和在接下來的48小時。內部和外部驗證後,未來1年進行驗證來驗證模型的影響。三個數據庫來自三個國家,在亞洲,歐洲和北美,證明該模型在一定程度上是普遍的。
盡管大量的數據,許多數據庫仍然不適合未來的研究,因為他們沒有及時更新。Tomašev等阿基預測模型的研究提供了大量的數據。10研究了703 782名成年患者60億個別項目,其中包括620 000個元素。在這項研究中,一個神經網絡模型用於深度實時預測。共有55.8%的嚴重的AKI患者預測在48小時內,雖然每一個準確的預測是伴隨著兩個錯誤。10這項研究提供了一種新的方案實時預測和表明我們應該獨立前瞻性評估和驗證模型來探索它們的有效性。在未來的研究中,Flechet等相比252年阿基預測模型與臨床醫生患者的臨床療效,發現隨機森林模型預測AKI-II / III相當於臨床醫生。我們的預測模型的圖形可視化模型安裝在該中心的數據庫更好的使用。此外,我們每天更新數據庫來實現日常預測和研究結果。在我們的研究中,前瞻性驗證預測模型的穩定性確認其承諾,為未來的研究提供了基礎。
有許多研究人工智能預測阿基的發生,但大多數都是隻有研究,推斷效應一直存在爭議。Koyner等第一項研究發表的阿基預測模型基於多中心數據。02 961患者,17 541(8.6%)有阿基,4251 (3.5%)AKI-II和1242例(0.6%)有AKI-III。多元邏輯回歸模型用來預測阿基在這項研究的AUROC 0.74。與阿基的分類、預測模型的AUROC逐漸增加到0.84。8隨後,該研究小組使用一種新的機器學習算法,建立一個更精確的模型來預測AKI-II的出現,在24小時內的AUROC 0.9和0.87在48小時內。19最近,研究小組包括數據從其他兩個中心,即LUMC (N = 2 00 613)和新加坡國立大學(N = 2 46 895),與AUROCs外部驗證AKI-II預測模型達到0.85 - -0.86,這表明人工智能模型具有穩定的預測能力。12這一係列的研究包括許多數據點,表明人工智能診斷AKI的可行性,但積極的患者的比例(3.5%)和ICU病人(30%)太低正確預測阿基。我們的研究是與上麵的類似。SAHZJU-ICU數據庫是一個隻有數據庫代表中國東南部和模擬數據庫是一個著名的開放ICU數據庫在美國。AmsterdamUMC數據庫是一個公共數據庫位於歐洲。的人口結構和疾病分布的三個數據庫完成但不同並發症和種族。因此,它提供了一個與其他研究相比與無與倫比的穩定性預測模型。
限製
這項回顧性多中心研究無法進行更多的臨床特性礦業和比較,因為不同的數據結構。三個數據庫之間的差異在一定程度上反映了一些人口統計學差異歐洲、美國和中國,導致預測模型的準確性的下降。有一些差異的患者數量包括在三個數據庫,可能影響變量的選擇。作為研究設計的結果,我們刪除了ICU患者住院治療的48小時之內,這可能導致患者大多數相對溫和的排斥和可能減少假陽性。第二,在未來的2020年的數據研究,可能存在偏差的患者納入中心,從而影響後續潛在的解釋結果。最後,鑒於嚴重阿基的低發病率和偉大的正負樣本的比例不同,數據可能是偶然的。我們的模型似乎優於AKI診斷non-AKI病人而不是因為我們包括積極的數據的比例。回顧性研究,我們負麵數據的比例減少了隨機但保留所有日期在未來階段的敏感性降低。
結論
基於數據庫的患者來自不同國家的不同種族,我們建立穩定的機器學習模型預測的發生在接下來的48小時。前瞻性驗證通過更新本地數據庫的實現是一種有效的探索進一步的研究。
數據可用性聲明
沒有數據是可用的。
倫理語句
病人同意出版
倫理批準
這項研究是評價和倫理委員會批準浙江大學醫學院第二附屬醫院為研究號碼2019 - 078。
確認
感謝我的同事一般ICU配合我們的前瞻性研究。由於兩個公共數據庫即模仿和AmsterdamUMC提供重要的數據。感謝所有病人顧問。
引用
補充材料
-
補充數據
僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。
腳注
貢獻者範本:QL和MH;方法,YX;軟件:YX;驗證:,YZ YX;正式的分析:JC和XC;資源:MH;數據管理:QL;原創作品草稿準備:QL;writing-review和編輯,MH:可視化;YX; supervision: YZ and QL; project Administration: QL. MH is responsible for the overall content as the guarantor.
資金作者並沒有宣布具體資助這項研究從任何公共資助機構,商業或非營利部門。
相互競爭的利益我們之間可能會有一些潛在的利益衝突研究和HealSci科技有限公司北京。在這項研究中,我們共同完成工作包括數據集成和代碼轉換模型建設和模型可視化項目根據合同。
出處和同行評議不是委托;外部同行評議。
補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。