條文本
文摘
客觀的測量罹患衛生保健相關感染(HAI)病的發病率是越來越重要的在當前醫療輸送係統。行政數據算法,包括(組合)診斷代碼,通常用於確定海的出現,支持within-hospital監測項目或獨立的質量指標。我們進行了一項係統回顧評價診斷檢測海行政數據的準確性。
方法係統的搜索Medline和Embase, CINAHL和Cochrane相關研究(1995 - 2013)。方法學質量評估是使用QUADAS-2標準執行;診斷精度估計被海分層類型和關鍵的研究特點。
結果57個研究均包括在內,大多數旨在檢測手術部位或血液感染。研究設計非常不同的規範行政數據算法(代碼選擇,後續)和定義海的存在。三分之一的研究有重要的方法論的限製包括微分或不完整的海確定或缺乏致盲的陪審員。觀察到的敏感性和積極的預測值海行政數據算法檢測非常異構和一般溫和的在最好的情況下,對於within-hospital算法和正式的質量指標;精度特別貧困的識別設備等海中央線相關血液感染。對麵的大異質性研究設計包括研究杜絕正式計算總結診斷精度估計在大多數情況下。
結論管理數據和高度有限變量精度檢測的海,和明智地使用內部監測工作和外部質量評估建議。如果醫院和決策者選擇依靠海行政數據監測,持續改進現有算法和可靠的驗證是必不可少的。
- 流行病學
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/
來自Altmetric.com的統計
本研究的優點和局限性
行政數據算法,基於放電和程序代碼,正越來越多地用於促進監測工作和得到質量指標。
這種全麵係統回顧明確區分行政數據算法開發了住院(外部)的監測和質量評估。
所有包括主要研究受到徹底的方法學質量評估;主要研究這發現頻繁的風險的偏見。
主要研究關於學習方法的不同性質和算法杜絕池的結果在大多數情況下。
介紹
護理質量的評估和監測病人的並發症是一個關鍵的概念在當前醫療輸送係統。1特別是行政數據和排放法規,已被用來作為定義患者群體有價值的信息來源,評估疾病嚴重程度,確定病人結果和檢測不良事件,包括罹患衛生保健相關感染(HAI)病。2 - 4在某些情況下,行政數據是用來衡量護理質量和管理支付獎勵。例子包括患者安全指標(psi)由美國衛生保健質量的研究,減少支付罹患衛生保健相關條件(hac)認為病預防和價值取向的采購(VBP)的擴張計劃,由美國聯邦納稅人實現。5 - 8海利率報國家監測網絡如美國國家醫療安全網絡(NHSN)往往決定通過圖表回顧臨床病人信息。雖然這些更多的臨床利率越來越多地采用質量計劃,管理數據仍然是一個關鍵組成部分海對納稅人和一些質量檢測測量項目。4,6
盡管如此,許多很有警示管理數據的準確性對海監視的目的。1,9 - 11他們的普遍使用,緩解可訪問性和相對標準化的設置和時間讓他們吸引大規模的監測和研究工作。side-inherent翻轉,其目的是組織計費和報銷healthcare-administrative數據沒有海的監測而設計的。因此,當分配主要和次要放電診斷代碼,其他利益可能有更大的優先級,例如,最大化報銷保健交付。此外,診斷代碼賦值的可靠性在很大程度上依賴於足夠的臨床文檔和診斷的數量關係可用字段的數量。3,12
對海監視的目的,不同的目標應用程序管理數據的算法定義的一致性是最重要的措施。首先,他們可能會被用作case-finder支持within-hospital監測工作,單獨或結合其他指標海等微生物學文化的結果或抗生素配藥。在這種情況下,足夠的靈敏度可能優於陽性預測值(PPV)識別患者需要人工確認的海。另外,放電編碼可用於外部質量指標算法,直接確定海的發生,因此衡量醫院的性能。3,9,13在此設置,高PPV觀察到的信號可能是更重要的比檢測海的所有情況。本係統評價的主要目的是評估發布行政數據算法的總體精度監測(檢測)廣泛的海。我們還確定算法的準確性為within-hospital開發監測不同於那些用於外部質量評價。此外,我們嚴格評估納入研究的方法學質量使用QUADAS-2工具為係統評價診斷準確性的研究開發並評估可能的風險的偏見的影響。
方法
這個係統包括研究評估行政數據算法使用放電的診斷準確性和/或程序代碼檢測海。研究評估感染或與特定的病原體(如耐甲氧西林殖民金黃色葡萄球菌或艱難梭狀芽胞杆菌)並不包括實驗室監測可能被認為是更合適的。這個分析的結果報告按照棱鏡的指導方針。14本文沒有收到協議登記。
搜索
Medline和EMBASE, Cochrane數據庫和CINAHL發布的研究從1995年開始管理數據和查詢相結合的表示(罹患衛生保健相關)病感染(見在線補充數據1 S1)和限製將文章發表在英語、法語或者荷蘭。搜索了2012年3月8日和2013年3月1日關閉。
研究選擇
定義適合包容,以下標準應用:(1)研究評估一致性管理數據和海之間發生,(2)數據包括來自1995年或以後的數據可能是早些時候generalisability有限目前實踐中,(3)研究並沒有反映自然語言處理,(4)研究原始研究而不是評論或重複的結果。選擇的研究是由一個評論家(MSMvM)和交叉引用來檢測可能錯過了研究。包含不限於特定地理位置或患者群體,也沒有一個完整的數據可用性要求。
定義
管理數據的算法被認為是該指數測試(即測試接受調查)。這些算法包括選擇診斷和/或程序代碼用於計費或其他目的。代碼在每個算法的選擇要麼是具體研究,或者在某些情況下,他們是預定義的指標用於付款和質量評估。後者包括psi, hac或定義的代碼選擇賓夕法尼亞醫療成本控製委員會(PHC4);大多數人使用和發展在美國,但是,psi也被用於其他國家。6,15參考標準是海的存在與否取決於回顧病人的臨床記錄,根據國家感染監測方法(如NHSN),定義從美國外科等手術質量監控項目質量改進項目(SQIP)或其他定義。
質量評價和數據提取
經過選擇的研究、質量評價和數據提取進行了由兩個獨立評論家(MSMvM PJvD)使用修改QUADAS-2質量評估標準的診斷準確性的研究(見在線補充表S2數據提取形式,細節和假設)。16,17
簡而言之,這些標準的風險評估偏見和適用性評審問題對病人的方法選擇、指標測試和參考標準。此外,該標準提供了一個框架來評估偏差引入的風險(在)完成海斷定,所謂“病人流”。點特別關注在質量評估海確定是否失明行政的結果數據的識別算法和部分或微分驗證模式。部分驗證時並不是所有患者評估海(收到參考標準),依賴於模式的結果指標測試。在微分驗證的情況下,並不是所有的病人評估指數測試收到相同的參考標準。根據部分和/或微分的模式驗證,這可能引入偏差下的觀測精度的估計算法研究。18幾項研究包含多種類型的驗證模式,海的方法確定或行政規範數據算法;質量評價和數據提取然後分別適用於每一個所謂的比較。方法學質量觀察者之間達成協議的討論。
分析
包括研究目的被海類型和分層的應用程序的管理數據在海的過程監測。之間的區別是由算法旨在支持within-hospital surveillance-either隔離或結合其他指標和那些發達的外部護理質量評價。此外,研究基於QUADAS-2被偏見的風險分類標準。森林情節描述創建報告的敏感性、特異性、正麵和負麵預測值海管理數據算法的檢測。
如果足夠大足夠相似研究組完成2乘2表,估計使用二元方法敏感性和特異性都彙集在Cochrane手冊推薦係統評價的診斷準確性。19,20.這一分析聯合模型的敏感性和特異性分布,占這兩個結果之間的相關措施。沒有發表偏倚的正式評估。所有使用R V.3.0.1分析(http://www.r-project.org)和SPSS統計20(美國、IBM、紐約Armonk)。
結果
研究特點
研究人口的研究設計、選擇、方法作為參考標準和管理數據規範變化很大。這個大變異性研究特征杜絕代摘要估計敏感性和特異性對於大多數類型的海。作為參考標準,35研究NHSN方法應用於確定海存在,六海定義為在SQIP注冊,剩下的研究使用臨床或其他方法(表1)。由感染病例定義應用preventionists 24研究,以及訓練有素的護士、醫生或其他萃取器。十八within-hospital監測的研究評估算法,並與其他指標15結合行政數據的感染(如微生物培養結果或抗生素使用)來檢測海。24研究評估行政數據顯式算法用於外部質量評估,如psi或工廠。隻有7個研究提供數據收集的2008年之後。36,45,53,66年,69年,31日,34
方法學質量
圖2總結每個QUADAS-2偏見的風險和適用性問題域(有關詳細信息,請參閱在線補充數據S3研究;S4數據的海類型)。高偏差的風險流組件中相當大的一部分包含研究。海地位的確定在37 57研究完成;換句話說,隻有65%的研究相同的參考標準適用於所有或包括病人的隨機樣本。選擇驗證模式是:隻有那些病人被行政數據的評價(9),評估患者的標記通過行政數據或另一個測試(例如,微生物測試)(8)和第二次審查後重新分類不符情況。高偏差的風險流組件經常跟“無法提取完整的數據對診斷精度,主要是由於部分驗證。隻在研究評估PPV,海斷定是有限的病人被行政數據;這部分驗證本身不是問題;然而,缺乏致盲陪審員可能還引入了整體風險的偏見。
手術部位感染
三十四項研究評估手術部位感染(SSI);大多數研究發現人口風險(分母)通過選擇特定的程序代碼從索賠數據,盡管一些包括所有病人承認外科病房。細節管理數據中指定算法在線補充表S6。算法研究中應用NHSN方法作為參考標準通常也包含診斷代碼分配再入院期間完成所需的後續持續時間,和幾個檢測SSI包含後續程序。
精度估計高度變量(圖3看到在線補充S5A),組內也研究相同的目的目標程序和應用程序(PPV靈敏度範圍10 - 100%,11 - 95%)。幾項研究評估多個規範行政數據的算法;正如預期的那樣,使用一個更廣泛的選擇放電編碼檢測到更多的PPV SSI的成本低。26,47,54研究之間沒有明顯關係所包含的代碼的特異性和觀測精度(ICD9碼998.5,996.6(或同等)與一個更廣泛的選擇,數據未顯示)。檢查森林的情節表明,總的來說,研究具有高的風險偏好顯示更多有利的診斷準確性比那些更健壯的方法學質量,也許除了心髒手術。
血液感染
24的研究評估血液感染(BSI),一半集中在中央line-associated BSI (CLABSI)和19個評估外部質量評估算法。的方法確定患者中央線是非常多元的:研究評估PSI 7(中央靜脈導管相關性BSI)或HAC應用特定的排放法規,而其他的研究隻包括患者陽性血培養67年或依賴手工監測確定中央線的存在(見在線補充表S6)。69年CLABSI檢測的敏感性不高於40%的一項研究。值得注意的是,隻有不依靠行政數據的研究來確定中央線實現靈敏度20%以上(圖3B和看到在線補充S5B)。管理數據的靈敏度算法檢測BSI略高。PSI的總靈敏度13(“術後膿毒症”)使用SQIP方法研究作為參考標準為17.0%(95%可信區間6.8%到36.4%)的特異性為99.6%(99.3%對99.7%)。算法用於外部質量評估的ppv千差萬別,通常是< 50%,這表明這些質量指標檢測到許多沒有(CLA) BSI的事件。再次,研究設計偏見傾向於風險較高的顯示精度高。
尿路感染
15個研究調查了尿路感染(UTI),七個專門關注catheter-associated泌尿道感染(CAUTI)。算法依賴行政數據,以確定患者尿導管,CAUTI檢測的低靈敏度顯著(圖3C,看到在線補充S5C S6)。78年,76年泌尿道感染敏感性較高,但ppv普遍低於25%,除了研究Heisler等;這項研究中,然而,另外受到標記記錄泌尿道感染的存在。34
肺炎
14個研究評估肺炎,其中9個專門與機械通氣相關肺炎(VAP)的目標。機械通氣的存在是決定在管理數據的算法34,43或通過手動方法。67年VAP, PPV靈敏度範圍從35%到72%,從12%降至57%。為肺炎、敏感性和PPV始終在40%左右徘徊,雖然非常不同的方法(使用的研究圖3D,看到在線補充S5D)。
其他海和聚合估計
一項研究評估的價值管理產後子宮內膜炎的檢測數據(數據提取不可能的)和一個drain-related腦膜炎的發生。此外,六個研究數據聚合多種類型的海(圖3E,看到在線補充S5E)。這些研究,靈敏度不超過60%,具有類似或更低的ppv。
討論
根據評估的越來越多的關注,改善和獎勵的醫療質量、高效和可靠的措施檢測海是至關重要的。然而,證明了這個綜合係統的評估,管理數據有限,非常variable-accuracy海的檢測。此外,算法識別侵入性感染相關設備(如中央線和尿導管尤其成問題。包括所有研究非常規範的異構數據管理算法和參考標準。徹底的方法學質量評估顯示不完全確定的海狀態和/或缺乏致盲的評估發生在三分之一的研究中,因此引入偏差和複雜的風險平衡的解釋精度估計。研究采用設計與風險更高的偏見似乎提供了一個更樂觀的畫麵比使用更健壯的方法。
行政數據的缺陷為目的的海監測之前一直強調,特別是從的角度(外部)interfacility比較。3,9,11,79年相比,最近的一項係統回顧,評估管理數據的準確性對海監視,9我們發現了一個更大數量的主要研究(部分原因是更廣泛的入選標準)和區分行政數據算法開發不同的應用程序。這之前的審查表明,盡管他們溫和的敏感性,行政數據可能是有用的在更廣泛的算法(自動化)常規監測;值得注意的是,我們係統綜述的研究表明適度增長效率比其他自動化的方法。23,25,26,32,63年,67年,74年令人驚訝的是,沒有明顯區別行政數據算法開發了支持within-hospital監測的目的和用於外部質量評估的靈敏度或PPV。靈敏度是高度可變,ppv溫和在最好的情況下,還在算法目標非常具體的事件(CAUTI CLABSI)外部基準測試或付款規則。然而,行政數據可能是有利的目標跟蹤時hai需要跨多個醫療設施或出院後監測水平的護理,如SSI。41,80年重要的是,相當數量的研究在美國進行,與特定的計費和質量評價體係;因此,一些質量標準和編碼係統可能並不適用於其他國家。
許多以前公布的研究探索原因行政數據無法檢測海。為特定的質量措施,海定義質量標準之間的差異和NHSN方法可能占的部分不和諧的情況下,81年;其他解釋包括錯誤檢測感染present-on-admission (PoA)或感染與目標設備,不正確的編碼,不足臨床文檔,挑戰識別入侵設備或編碼字段的數量有限。53,69年,44,51,76年,82年,83年之間的不穩定的平衡質量管理數據的準確性和使用測量和績效工資計劃爭論之前,尤其是當這些努力可能會鼓勵編碼實踐,進一步削弱行政數據的準確性。11最近的研究提供了混合證據關於編碼實踐的變化以應對金融約束引入或公共報告項目。84 - 86
幾個編碼係統的改進正在進行中,可能會影響未來的性能管理數據。首先,過渡到第十屆修訂的國際疾病分類(icd - 10)可以提供增加特異性由於粒度更大的可用的代碼。87年隻有7個研究綜述使用icd - 10,通常在設置並不直接與設置使用ICD-9(主要是美國),和一些研究故意映射模擬ICD-9 icd - 10編碼。第二,編碼字段中可用的數量(標準化)計費記錄增加了近年來,允許更次要的診斷記錄;然而,目前尚不清楚擴張超出15個領域將受益海登記和其他並發症。60,88年第三,采用PoA精度指標代碼賦值還有待驗證的過程中,他們將隻有很少的研究包括在本文中。78年,89年最後,本係統評價不能提供足夠的數據來評估改變編碼精度自2008年美國金融約束引入某些工廠沒有出現在入學。正在進行的研究需要評估這些變化的影響編碼係統對海監視他們的準確性。
部分或微分驗證模式的頻繁使用也可能被解釋成著名的傳統局限性與質量監控作為參考標準與應用人工監測的工作負載大量的病人。23,25,26,32,63年,67年,74年雖然第二次審查後將錯過的情況下將導致更精確的檢測海,這個微分應用程序第二次審查可能偏見的性能估計向上,18除非我們能將書本知識運用於()的一個隨機樣本所有情況下,包括整合HAI-negative和HAI-positive病例。23,67年,90年
盡管努力識別所有可用的研究,我們不能排除錯過的可能性研究和評估也沒有發表偏倚。此外,作為搜索被關閉在2013年3月,許多領域內的主要研究這個係統回顧已發表以來關閉搜索。這些研究的結果是符合我們的觀察。80年,82年,83年,90 - 99此外,由於我們的廣泛的入選標準,包括研究非常多樣化,複雜化的解釋結果。與先前的係統回顧,9可比的少量研究讓我們避免產生集中總結估計在大多數情況下。未來的管理數據的準確性評估應該考慮應用相同的參考標準所有的病人,即使是難以實現的一個隨機樣本的每個子群2乘2表,確保致盲的陪審員。促進平衡的解釋結果,診斷準確性的估計計算之前和之後重新分類也應單獨報告。One hundred.
結論
管理診斷和程序編碼等數據有限,和高度可變,監測精度的海。海檢測靈敏度不足在大多數研究和管理數據算法,目標具體海外部質量報告也一般可憐的ppv,識別設備感染是最具挑戰性的。研究的相對缺乏一個健壯的方法和不同性質的研究,結合連續改進的編碼係統,排除可靠的預測的準確性管理數據在未來的應用程序。如果繼續被用於管理數據海監測的目的,基準測試或付款,改進現有算法和可靠的驗證是必不可少的。
引用
補充材料
-
補充數據
僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。
- 數據補充1——在線補充
腳注
推特遵循Maaike van Mourik@vanmourikmaaike
貢獻者MSMvM設計研究中,進行了搜索,批判性的評價研究,進行分析和起草的手稿;PJvD批判性的評價研究,並幫助寫手稿;MJMB KGMM輔助研究設計中,關鍵的評估,數據分析和寫作手稿;GML協助研究設計、數據解釋和寫的手稿。
資金MJMB和KGMM收到各種資助來自荷蘭科學研究組織和一些歐盟項目除了無限製的研究經費從葛蘭素史克KGMM,拜耳和勃林格公司研究機構。GML獲得衛生保健研究的資助(R01 HS018414)以及美國國立衛生研究院資助,疾控中心和食品及藥物管理局。
相互競爭的利益沒有宣布。
出處和同行評議不是委托;外部同行評議。
數據共享聲明沒有額外的數據是可用的。