條文本
文摘
目標評估是否未來的研究開發預測模型基於醫療保險索賠數據的再入院早期在住院治療的時間是值得的。
設計回顧性隊列研究的住院出院日期2014年1月1日至2016年12月31日。
設置全因急症護理醫院錄取一般人群的瑞士,參加Helsana集團瑞士的大型供應商強製健康保險。
參與者138年的平均年齡222年住院成人包括在這項研究是60.5年。住院患者隻包括與他們的第一個索引。已故的患者在隨訪期間被排除在外,以及病人和/或養老院或出院康複診所。
措施主要結果是30天重新接納率。接受者操作特征曲線下麵積(AUC)是用來衡量發達邏輯回歸預測模型的歧視。候選人變量理論基礎和來自係統的文獻檢索。
結果我們觀察到一個30天的再入院率為7.5%。55候選人變量被確定。最終模型包括pharmacy-based成本組(PCG)癌症,PCG心髒疾病,PCG疼痛,緊急指數承認,緊急訪問、專家、成本費用醫院門診,實驗室成本,成本的治療設備,成本物理治療,門診訪問數量,性別、年齡和地理區域預測。預測模型實現了AUC為0.60 (95% CI 0.60 - 0.61)。
結論基於我們的研究結果,它不是承諾投資資源大規模研究發展的預測工具,大大減少基於醫院的健康保險索賠數據。數據證明適當的調查人住院,隨後再入院的發生,但我們沒有發現證據的潛在臨床有用的預測工具僅根據patient-sided變量。
- 重新接納
- 索賠數據
- 預測模型
- 瑞士
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
來自Altmetric.com的統計
本研究的優點和局限性
這項研究有助於調整未來的研究與發展的預測工具,醫院再入院。
它擴展了現有的文獻通過關注潛在的預測在索賠時數據和住院治療。
研究人口並不局限於特定的條件或年齡組。
選擇合格的潛在的預測是基於一個係統的文獻檢索。
隻有一小部分的預測中使用現有的模型可以從瑞士索賠數據和住院的時候。
介紹
醫院的患者再入院描述事件必須返回相同的或另一個醫院出院後不久。再入院醫院都是常見的和昂貴的。1再入院的一部分被認為是可以預防的。2他們承諾方麵質量改進措施,對醫療保健係統和/或醫院的水平。3
先前的研究表明,可以有效地減少與幹預措施,如病人再次入院放電指示或安排後續訪問前放電。4個5
在瑞士,目前討論了數字化醫療係統可以用來提高效率。特別是,它是假定使用常規數據(如索賠數據)並不能反映其潛在增加衛生保健係統的效率。6
再次入院預測模型(HRPMs)計算的風險病人隨後重新接納基於個人特征,例如,年齡或並發症。索賠數據包括詳細信息對病人醫療服務利用率和成本水平,係統回顧HRPM HRPM顯示,他們是一個有用的依據。7 8
避免再次入院醫院已在瑞士一個高優先級。9利率計算係統,發表在一個醫院的水平。因此,開發工具為後續識別高危病人rehospitalisation為基礎定製相關幹預措施為醫院、質量機構和成本費用。考慮到全國性的健康保險索賠數據,已有的和標準化的,他們可能是非常有用的。他們可能會克服障礙的額外的數據集合。
本研究的目的是開發一個概念驗證HRPM評估patient-sided因素是否存在一個住院的時候,可以從瑞士承諾再入院早期預測醫院索賠數據。這樣一個模型的潛在目標受眾(瑞士)健康保險和他們的合作夥伴。醫療保險運行模型的數據庫可以同意特定幹預對高危病人被各自的HRPM醫院作為其病例管理計劃的一部分。
方法
數據來源和研究設計
對所有瑞士居民基本醫療保險是強製性的。大量的民營企業提供覆蓋廣泛的醫療服務被認為是適當的,醫學上有效和具有成本效益的。人可以自由切換醫療保險一年一次。他們可能在某種程度上選擇他們的扣除額,選擇不同的健康計劃。
所有健康計劃允許報銷服務覆蓋每一個批準的醫療服務提供者,在住院和門診。退稅的人均保費的回報,一些健康計劃需要一個特定的保健提供者(全科醫生或遠程醫療提供者)為每一個新的健康問題的第一次接觸。有些第一次接觸供應商委托醫療保險建立綁定處理程序和限製的報銷沒有事先谘詢供應商的第一次接觸了其他服務(如專家訪問)。10
這個回顧性隊列研究使用行政索賠數據Helsana集團的一個大型醫療保險市場約14%的份額的瑞士人口(即應用。120萬人)。初請失業金數據提供的信息使用的醫療服務保險,以及保險狀況和社會人口信息。急性住院病人護理服務的補償是通過全國diagnosis-related監管組織(DRG)關稅SwissDRG。11
文獻檢索
識別潛在的預測重新接納,我們選擇了一個theory-driven(相對於一個數據驅動)的方法。因此,我們係統地尋找HRPM係統評價和預測指標用於描述模型提取到一個候選池變量。數據庫中的條目PubMed匹配濾波器的係統回顧和醫學主題詞(網格)的病人重新接納和選擇模型,統計。作為第二搜索字符串過濾係統綜述的再次使用,這一次一起下列單詞的至少一個標題或摘要字段:重新接納,rehospitalisation,模型和預測。沒有額外的限製出版日期。
我們看這些出版物的抽象和應用以下排除標準:沒有係統複習,不包括正確的結果再入院(醫院),兒科病人,沒有作為索引住院急性護理幹預。選中的出版物被作為全文檢索,和兩個進一步的排除標準:沒有患者的立場特征預測和預測報告列表。
此外,我們檢索研究評估住院治療上瑞士的瑞士醫療設置使用索賠數據基本強製性醫療保險和提取患者的立場與住院費用相關的因素。這一步確保了特定國家的國際研究中不考慮的問題。
重新集結了預測上市公司分為七類:臨床評估,共病情況,疾病嚴重程度,整體健康和功能,圍手術期的變量,使用醫療服務之前,社會人口變量。候選人變量被評估通過的三個標準:是否描述患者的立場特性,如果他們可以從瑞士的健康保險索賠數據(直接或間接地,例如,通過藥物的使用),如果他們可以在入學。
結果
主要的結果再入院全因任何急症護理醫院出院指數的30天內急性護理住院。這一結果在HRPM使用最廣泛12這樣的比較我們的模型的性能與先前的研究是可行的。根據敏感性分析,我們另外再入院評估診斷相關補償在單一情況下(即最大的18天內和在相同的主要診斷類別,MDC)和60和90天再入院。
2014年、2015年和2016年被篩查任何瑞士急症護理醫院住院治療上。排除標準:今年19歲以下的病人住院治療,住院治療上因事故或交付,精神病住院治療上,在90天內死亡的病人出院後,住院的情況下後跟一個呆在急症護理醫院以外的任何住院機構(例如,養老院、康複診所)。如果病人是住院好幾次在調查期間,我們隻包括第一個。
候選人變量和額外的措施
所有候選人變量之前使用衛生服務考慮數據索引住院前一年時間。數據包含購買力衡量郵政編碼的水平。這個變量包括集中值的意思是100年在瑞士人口。這是作為一個近似的個人的社會經濟地位。按成本反映了住院的複雜性和重量由集中值的意思是1。我們可以不包括這個變量的預測模型,因為它隻是出院後可用。然而,這個變量允許我們評估我們的研究是否人口不同主要來自瑞士人口住院治療上的複雜性。
為了考慮非線性預測模型,所有候選人連續變量被分成類別,沒有數據的分層。患者的年齡分成類別的10年,以開放的下界的類別29,和開放的上限90年在上麵的類別。成本變量和門診訪問的數量分為沒有成本/訪問,上麵沒有成本/訪問第三個四分位數,和成本/訪問第三個四分位數以上。購買力分為低於第一個四分位數,第一和第三個四分位數之間,第三四分位數以上。計數變量計數較低(緊急訪問,住院前、並發症和搬遷)被分成/不,沒有一個和多個/一次。索引的停留時間(洛杉磯)的入學二分到低於3天,3天及以上。在敏感性分析中,我們集中、擴展和轉化(Yeo-Johnson轉換)所有連續變量而不是分辨他們。所有MDCs占不到2.5%的病例分組在一個類別(其他)。雅致農村和城市之間的歧視(中心城市,孤立的城市和聚集)。
統計分析
我們確定了157 940名合格指數住院患者的篩查。患者排除如果他們尋求庇護者,Helsana雇員或在國外住(3876),當他們沒有保險Helsana整個觀測期間(前1年和3個月後指數住院,626),和患者藥物收取一次性從幼兒園回家(3221)。最後的研究人群,因此,由138年的222人住院,其中53.2%是女性,平均年齡為60.5歲。沒有缺失數據估算的結果數據集。
首先,人口總數的描述性分析研究和子組。因為之前HRPM往往局限於特定的人群7在年齡方麵,位置,緊急招生或具體情況,我們從不同的角度具體探討這些變量(人口分布,原始重新接納率和模型性能)。我們使用下麵的子組:最大的年齡群體,最大的地理區域,緊急入院,患者手術病人,醫學患者,患者最普遍的MDC,最高的MDC生再入院率和索引的住院患者3天或更多。除了主要的結果再入院(30天),我們看了三個次要結果不同隨訪時間。
雙變量分析結果和可用的變量之間利用克魯斯卡爾-沃利斯檢驗,確切概率法,X2測試和似然比檢驗(輕軌車)。預測模型是一個廣義線性模型與二元因變量(回歸)。在敏感性分析中,我們使用一個普遍mixed-effects模型與隨機攔截/醫院。
住院病人和他們的指數的特點研究人口分層計算的主要結果。我們繪製一個kaplan meier曲線的再入院觀察描述患者的分數,沒有時間出院後重新接納。生重新接納的主要結果分層研究人口計算的子組顯示哪些患者再入院早期主要是受。
的預測因素,最終確定模型的啟發式方法的四個步驟。首先,我們進行了輕軌交通的主要結果分別和每個可用的候選人變量。所有候選人變量一起導致p < 0.001初始化模型在第二步。第二步迭代時移除一個變量根據其Akaike信息標準。我們停止這一步一旦不再變量沒有顯著惡化的模型適合可以刪除。這些前兩個步驟是廣泛用於HRPM的發展。12由於前麵的步驟往往高估太多的大型模型預測overfit數據。13我們添加了一個手動第三步。我們手動變量從模型中刪除他們的估計係數不一致時(如醫療計劃)、小與大的變化(例如,家庭護理成本),或者當大了各自特點的影響非常稀缺(例如,假肢的國旗,一些pharmacy-based成本組(PCG))。在第四步中,我們測試了可能影響修改變量的交互通過執行輕軌交通的選擇變量和變量所有可用的候選人。如果這些變量的估計係數模型分割顯示顯著的交互項的最多貼切地不同,交互項添加到模型中。估計係數的預測模型顯示為口服補液鹽和CIs的95%。
為了評估模型的歧視,我們計算曲線下麵積(AUC) k-fold交叉驗證(k = 20)。這樣做是對總樣本,患者亞組分別和不同的結果。我們顯示校準攔截(calibration-in-the-large)和模型的校準斜率與整個研究人口和主要結果校正措施。14我們估計截距和斜率加權線性回歸模型,與數量的觀察權重。
模型預測的成功與一個隨機測量的數據分割成一個培訓(75%)和一組測試(25%)。我們使用切割點最大化的真陽性和最小化假陽性率,以確定哪些患者可能經曆一個重新接納。
與真正的預測結果,然後我們計算以下措施:積極的預測價值(PPV)的負麵預測價值(NPV)、敏感性,特異性和檢測患病率(分享的病人將有rehospitalisation)。這樣做是對總樣本的主要結果。
在統計檢驗p < 0.05被認為是顯著的整個研究如果沒有否則。我們在R V.3.5.0所有進行統計分析。15
病人和公眾參與
無論是病人還是公眾參與規劃或設計的研究中,我們曾與輔助數據收集的健康保險公司報銷的目的。
結果
文獻檢索和候選人變量評估
文獻檢索結果在65年與一個重複的條目。我們排除了55出版物,因為他們不符合入選標準。這導致9包括出版物。7 16-23兩個出版物專門評估使用瑞士索賠數據的回歸模型另外包括在內。24日25日
所有變量的評估發現文獻中收集網上所示補充附錄1。提取的變量包括:候選人pcg,建立測量檢測一組22並發症在瑞士索賠數據,通過藥物的使用26變量醫療利用指數前一年住院治療(如分組成本、訪問和住院治療上),和社會經濟和社會人口信息(如性別、年齡、居住區域信息,購買力)。因為我們想建立一個模型隻使用在錄取信息,以下變量主要是在瑞士的健康保險索賠數據不能作為預測:洛杉磯,MDC和按成本的重量指數承認,和術後衛生服務使用。
人口
表1住院病人和他們的指數的顯示特征。研究人口分布在所有地理區域的瑞士,平均購買力指數,該指數住院治療上根據成本加權平均複雜度。
再次入院患者大約3歲和更多的男性,該指數重新住院治療上的人經常醫療(與外科手術相比),時間更長,有更高的複雜性相比non-readmitted人。爭取民主變革運動在指數分布不同的招生,後跟一個重新接納相比之下,那些沒有重新接納。最普遍的MDC指數招生之後,重新接納的循環係統,而在那些沒有重新接納這是肌肉骨骼係統。
所有潛在的雙變量分析預測的完整列表可以在入學的主要結果可以在網上找到補充附錄2。
生率
四個不同的重新接納率計算:30天內再入院的放電(7.5%,主要結果),在單一診斷相關情況(即在18天,2.9%),並在60(11.2%)和90天內再入院(14.0%),分別為。圖1顯示了累積發病率放電後再入院的天數。診斷相關二級結果重新接納在一個案例中描述圖1因為額外的限製應用內再入院(隻有相同的MDC指數錄取)。患者入院率的比例增加順利,與越來越多的天出院後減慢。基於圖1沒有單一的隨訪期間,應首選。
圖2顯示了原始的主要結果在選定的子組。紅線表示總研究人口的重新接納率。重新接納率上升,隨著年齡增長,顯示兩者之間的線性相關性除了最低和最高的年齡段。再次住院的比例不同地理區域之間沒有明顯的模式。重新接納率更高,如果指數住院緊急承認,對於一個醫療(相對於手術)保持或停留3天或更長時間。子組根據索引的MDC住院在很大程度上不同的重新接納率。患者最普遍的爭取民主變革運動,肌肉骨骼係統疾病,重新接納率最低(n = 362年29日,率= 4.0%)。住院治療,因為患者腎髒或尿路疾病的(n = 8598 = 16.3%)到目前為止,重新接納率最高,這是四倍多的肌肉骨骼係統疾病患者。
變量的選擇
第一步的變量選擇過程導致33變量p < 0.001有輕軌交通。自動變量逐步刪除第二步離開了21個變量在模型中。在第三步中,我們手動刪除7個變量(PCG痛風,PCG腸道炎症性疾病、假肢、家庭護理成本,成本藥物治療門診,健康計劃,語言地區)。
影響修改在第四步探討,但是考慮到交互條件沒有改善模型。因此沒有交互項添加到模型中。生成的最終模型包含以下14個變量預測:PCG癌症,PCG心髒疾病,PCG疼痛,緊急指數承認,緊急訪問、專家、成本費用醫院門診,實驗室成本,成本的治療設備,成本物理治療,門診訪問數量、性別、年齡、地理區域。
模型的性能
每個預測最後的口服補液鹽模型中描述表2。最大的影響是緊急的預測指數錄取(或1.50,95%可信區間1.43到1.56),醫院門診成本高(1.50(1.43 - 1.56)),年齡80 - 89年(1.50 (1.43 - 1.56))。
我們的模型的歧視性的力量是有限的(表3)。AUC使用整個研究人口為0.60 (95% CI 0.60 - 0.61)。擬合模型的特定的子組,這可能會更均勻,提高了模型的歧視在兩個子組(MDC肌肉骨骼係統和手術病人)。最好的AUC導致集團爭取民主變革運動的肌肉骨骼係統,它為0.66 (95% CI 0.65 - 0.67)。模型的校準很好。Calibration-in-the-large為1.02 (95% CI 0.28−-2.32),校準斜率為0.86 (95% CI 0.72 - 1.01)。
PPV使用平衡割點很低。模型中涉及到整個研究人口,占9.9%,這意味著9.9%的患者預測重新接納確實有一個。NPV為94.5%,敏感性為58.6%,特異性為56.8%。檢測患病率為44.3%。
表4顯示了靈敏度分析的結果與主和三個次要結果。模型歧視的隨訪時間略微增加。
討論
目前的研究發現,基於患者的立場變量預測模型在索賠數據和索引單獨招生的時候並不樂觀。因此,我們得出這樣的結論:更加複雜和資源密集型的嚐試比較廣泛的建模技術(如邏輯回歸,隨機森林,支持向量機,神經網絡)可能是不值得的。
結果似乎穩定在病人組,也就是說,對於年齡、地理區域、緊急狀況或臨床信息。開發模型歧視差,盡管它校準。使用mixed-effects模型靈敏度分析與隨機攔截/醫院和使用預處理(集中、擴展和轉化)而不是將連續變量沒有改善模型性能有意義(結果未顯示)。
子組的比較顯示,住院的患病率顯著差異和人口重新及其原料重新接納率。然而,我們沒有找到相關的改善模型性能如果我們安裝模型的子組。現有HRPM往往局限於這樣的子組。7這項研究的結果並不提供一個統計原因限製HRPM的目標人群。
基於臨床因素,討論爭議再入院30天是否合適的醫院的性能指標。27我們的數據沒有顯示某些HRPM隨訪時間,無論是在累積發病率還是在表演模型取得了不同的結果。
模型可以實現實時的使用限製輸入變量及時可用的存在,28 29以及模型依賴索賠數據。30 31然而,據我們所知,目前的研究是第一個結合這兩個方麵,開發一個模型與變量可以在承認是基於索賠數據。提前進氣入院率檢測模型(PREADM模型)28隻包括變量可以在錄取來自電子健康記錄和其他行政資源,包括慢性疾病登記行為風險指標和數據。它實現了AUC 0.69的測試集,並根據所選的PPV剪點從17.6%到34.3%不等。根據作者,重新接納的模型性能預測模型可能較低,因為隻有一小部分再入院的被認為是可避免的再入院(即可能發生由於隨機無法預防的健康問題)。一個模型隻使用索賠數據可以提高通過添加額外的信息(例如,臨床、心理)最近的一項研究在美國所示。30.然而,聲明隻之間的改善報告(AUC = 0.63)和更複雜的模型(AUC = 0.65)還是相當小的。類似的結果7日31日表明福利增加臨床數據,聲稱隻是模型,重新接納風險預測仍然知之甚少。
我們的模型的性能與現有方法和排隊待如下這樣一個實際的好處。模型是有用的,隻要確定病人rehospitalisation有高風險。我們的模型預測44.3%的病人有rehospitalisation(檢測流行),但實際上隻有9.9%的人(PPV)之一。這邊際改善我們的預測模型在一個無知的模型(50%檢測患病率和實際的PPV rehospitalisation率7.5%)並不證明模型的一個實現的成本投入生產。32
然而,研究了醫院再入院的理解的重要方麵。與現有的建議,7我們沒有找到有意義的變量之間的相互作用。病人的年齡是可用在大多數現有的模型,但是在大多數沒有考慮最終模型由於其小的貢獻。我們發現一個強大的年齡和重新接納風險之間的聯係。這可能是解釋我們包括範圍廣泛的年齡組而其他模型完全是基於一個老年人口。
患者緊急住院治療指數始終有一個高架重新接納風險在所有子組(或1.50,95%可信區間1.43到1.56)在一般人群)。緊急訪問索引入學前一年也再次入院的重要預測指標和患者沒有任何門診訪問也重新接納風險升高。緊急招生和沒有門診訪問可能會推遲尋求保健指標。自這三個變量與再入院率升高有關,它應該更深入地調查如果延遲再入院醫療是醫院的相關危險因素。此外,患者再入院率不同地理區域的瑞士千差萬別,即使我們控製了混雜的回歸模型。這方麵應該更詳細地研究未來的研究。
該研究的主要優勢是我們使用的數據的特點是高可用性和可靠性,包括普通人群以及所有醫療服務提供者的整個國家。我們可以觀察到大量的住院治療上(n = 138 222)和覆蓋大部分的居民瑞士。研究中再次住院的比例來衡量人口符合官方統計,33報告8.7%和12.3%再次住院的比例為30天,60天的2013年。
我們的研究需要考慮的一些局限性。盡管進行了文獻檢索係統,因此我們可能錯過重要的文章和相關候選人變量可能已經從我們的數據中提取。第二,瑞士索賠數據是我們唯一的數據源,因此,我們的結果可能不會轉移到其他國家。此外,每個病人納入研究人口隻有一次,因為我們隻使用第一人均住院住院治療指數。
本研究的目的是評估潛在的現有證據(即之前發表的文獻)和現有的數據源(例如,健康保險索賠數據)承諾風險預測工具。鑒於本研究計劃作為一個概念驗證,我們拍了一些簡化方法在模型建立過程中。所有連續變量的分類根據其分布在目前的數據幫助允許非線性關係的結果,但在這些變量導致一些信息的損失。雖然,靈敏度分析為中心,擴展和轉化(Yeo-Johnson轉換)連續變量,我們並沒有發現有意義的改進模型的歧視(見在線補充附錄3)。此外,我們使用邏輯回歸,這是最廣泛使用的分析方法在現有HRPM。然而,其他方法(如隨機森林)可以實現更好的歧視性的權力比邏輯回歸得到相同的數據。12
此外,我們使用基於理論的方法識別候選人變量。另外,數據挖掘方法可能得出不同的候選人從可用的數據變量,這可能導致一個更好的模型性能。然而,接受醫療保健專業人員是一個重要的先決條件的有效實施風險預測工具在臨床實踐中。我們確信,驗收時更高的預測來自醫學概念和技術完善與派生項目。
我們獲得一些影響從目前試點研究進行進一步的研究。首先,使用路徑後patient-sided因素目前在瑞士的時候住院本身並不是值得發展的臨床相關的風險預測工具。然而,第二,病人的健康保險索賠數據水平似乎非常有用的調查rehospitalisations和識別潛在的預測因子。他們可能會提供額外的有用的信息補充到當前報道醫院級別。9第三,鑒於patient-sided單獨因素似乎預測能力有限,我們假設,醫院級別的層次結構模型,包括數據能達到更好的效果。住院過程因素和衛生服務的供應,特別是醫院的病床,將重要的信息來解釋區域重新接納率的差異,7 34從而增加模型的歧視性的權力。此外,隨著國與國之間的再入院率相差很大,35也可能有助於研究激勵機製在不同的醫療保健係統。
結論
反對我們的假設,這種嚐試的預測模型rehospitalisations patient-sided變量僅來自瑞士的健康保險索賠數據的時候住院並沒有導致風險實際上有用的歧視。這個試點研究可能有助於未來的研究的設計和研究資源配置和質量保證的項目。基於這些結果,我們建議未來的研究專注於為病人的健康求助行為,代理人住院流程因素、供給參數或激勵機製在醫療係統層麵。結果是專門為正在進行的政治辯論在瑞士有關如何使用和實現醫療信息以增加醫療體係的效率。然而,由於這項研究是基於國際文獻綜述,結果也可能有助於研究人員與其他醫療保健係統。鑒於rehospitalisations發生的一部分是可以預防的,未來的研究如何識別高相關性的人口風險病人和所有涉及到的利益相關者。
確認
作者感謝Andri Signorell對他有用的分析數據的支持。
引用
腳注
貢獻者兩位作者參與的概念和設計研究的細化。BB進行了統計分析。兩位作者貢獻數據的解釋。BB起草了手稿,EB審查和評論。兩位作者閱讀和批準最終的手稿。
資金作者並沒有宣布具體資助這項研究從任何公共資助機構,商業或非營利部門。
相互競爭的利益兩位作者都在Helsana組在寫作的時候。
倫理批準在分析之前,預先存在的原始數據是匿名以保護病人和醫務人員的隱私。因此,按照瑞士聯邦數據保護,既不投保的同意也不需要這項研究倫理委員會批準。
出處和同行評議不是委托;外部同行評議。
數據共享聲明沒有數據是可用的。
病人同意出版不是必需的。