條文本
摘要
目標研究使用全球觸發工具(Global Trigger Tool)方法每兩周複查一次的記錄樣本增加對住院患者不良事件識別的影響。
設計回顧性觀察研究。
設置挪威一家擁有524張床位的綜合醫院信托基金。
參與者選取2010年1月1日至12月31日的1920份病曆。
主要的結果在兩種不同樣本量的記錄中確定不良事件的發生率、類型和嚴重程度,分別選擇10和70份記錄,每兩周進行一次。
結果在大樣本中,每1000個患者日(39.3個不良事件/1000個患者日)發現的不良事件比小樣本(27.2個不良事件/1000個患者日)多1.45倍(95% CI 1.07 ~ 1.97)。在兩個樣本中,醫院獲得性感染是最常見的不良事件類別,其他類別的不良事件在樣本間的分布無顯著差異。不良事件嚴重程度的分布在樣本之間沒有差異。
結論研究結果表明,雖然類別和嚴重程度的分布不依賴於樣本量,但不良事件的發生率是。為了檢測更準確的不良事件發生率,是否需要根據醫院規模調整最佳樣本量,還需要進一步研究。
- 定性研究
- 全局觸發工具
- 樣本大小
這是一篇開放獲取文章,根據創作共用屬性非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此作品的基礎上進行構建,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
數據來自Altmetric.com
本研究的優勢和局限性
這些樣本在年齡、性別和住院時間方麵相似。
未評估不良事件的可預防性。
隻比較了兩個樣本量。
每組樣本的事件驗證方法略有不同,然而,評審團隊之間的高評分者之間的可靠性表明一致性,因此不太可能影響結果。
簡介
十多年來,在整個醫療保健領域投入了大量精力來減少不良事件,從而在確定可靠和有效的工具來衡量此類事件方麵做出了許多努力。醫療保健改進研究所(IHI)的全球觸發工具被廣泛使用,並被認為是衡量不良事件的有效工具。1 - 3該方法包括從醫院出院名單中隨機選擇10個患者記錄的雙周樣本。兩名非醫師審稿人獨立搜索可能指示不良事件的預定義觸發因素。醫生確認他們對不良事件的存在和嚴重程度的共識。在兩周期間確定的不良事件為統計過程控製(SPC)圖表提供數據,用於分析不良事件發生率。然而,人們對此表示擔憂2,4 - 8關於該方法準確檢測不良事件發生率和發生率變化的能力,由於IHI方法推薦的兩周10份記錄的小樣本量。
在挪威,國家衛生局要求所有醫院信托基金使用翻譯版的全球觸發工具,連續審查至少10份記錄,每兩周審查一次,以便在國家一級監測每個醫院信托基金的不良事件發生率。9好等10建議樣本量應調整為醫院規模,並在此基礎上,我們將我們信托的樣本量增加到衛生當局要求的7倍,因為我們認為這將發現更準確的不良事件率。我們的不良事件發生率高於其他類似的信托公司,這些信托公司每兩周審查10份記錄的樣本,因此我們試圖評估我們的較高發生率是否由於樣本量更大。據我們所知,樣本量對不良事件發生率的影響尚未得到驗證,因此證明了進行這項研究的必要性。
我們的目的是在每兩周從同一人群中選取的兩種不同樣本量的記錄中獲得已確定的不良事件的發生率、類別和嚴重程度:一個樣本對應於IHI建議,另一個樣本大7倍。我們假設增加樣本量不會產生不同的不良事件發生率每1000個患者日。
方法
研究設計
該研究是一項觀察性橫斷麵研究,包括對兩個樣本的回顧性記錄回顧,分別為1680和240份(圖1).
設置
這項研究是在挪威北部諾德蘭縣三個地理位置的524個床位的醫院信托基金中進行的。這兩個樣本都是從2010年1月1日至12月31日排出的同一人群中選取的。但是,大樣本首先根據信托9項服務的離職情況進行分層,然後分別從5項服務和4項服務中抽取10條記錄,每兩周抽取70條記錄。小樣本包括10條記錄,每兩周從所有9項服務的彙總服務清單中挑選。根據IHI指南,在這兩個樣本中,17歲或以下的患者、主要為精神科或康複護理入院的患者或住院時間少於24小時的患者的記錄被排除在外。對整個住院治療進行了審查,包括在所有服務的患者天數,而不僅僅是在指數服務。
該研究得到了Nordland醫院信托基金數據保護官員和挪威區域倫理委員會的批準(參考文獻2012/1691)。
記錄複核法
審查員的培訓遵循IHI的建議,包括由有經驗的審查員提供的理論、實踐審查練習和彙報會議。我們使用了IHI對不良事件的定義1:“因醫療護理導致或由醫療護理導致的意外身體傷害,需要額外的監測、治療或住院,或導致死亡”.在指標出院(從服務的出院清單中選擇的出院)之前、期間或之後(30天內)給予治療的兩種不良事件都被包括在內,以評估醫療導致的不良事件總數。未評估已確定的不良事件的可預防性。
根據挪威語翻譯,將確定的不良事件分為23類11IHI全球觸發工具。這些類別進一步被歸納為八個主要類別(即醫院獲得性感染、手術並發症、出血/血栓形成、患者跌倒/骨折、藥物傷害、產科傷害、壓瘡和其他)。不良事件的嚴重程度被分為五個級別(E-I),使用的定義改編自國家用藥差錯報告和預防指數協調委員會(NCC MERP):12
E類:對患者造成暫時傷害,需要幹預
F類:對患者的暫時性傷害,需要初次或長期住院治療
G類:永久性患者傷害
H類:維持生命所需的幹預
第一類:患者死亡
兩組樣本的審查過程遵循IHI方法,1審查人員從挪威語翻譯的全球觸發工具的標準觸發器列表中檢查每條記錄是否存在觸發器。當確定了觸發因素時,他們檢查了表明發生了不良事件的文件;對於檢測到的任何不良事件,無論是否由觸發因素引起,均為上述八種類別之一並指定嚴重級別。兩組樣本的不良事件鑒定過程略有不同。對於小樣本,兩名護士(審稿人A和審稿人B)獨立審查了所有記錄,然後共同就不良事件的存在、類別和嚴重程度達成共識。然後,一名醫生(審稿人C)驗證了他們的發現。對來自大樣本的記錄進行鑒定的審查過程略有不同,因為每個記錄都由一名審稿人進行審查——要麼是一名護士(審稿人a),要麼是兩名醫生(審稿人C和D)之一。三名審稿人討論了他們的發現,並就所識別的不良事件的存在、類別和嚴重程度達成共識(圖1).在大樣本的審查過程中,每條記錄隻有一名審稿人,這是由於可用資源有限。
統計分析
獲取記錄的人口學變量。樣本間分類變量用χ進行比較2連續變量比較時采用獨立t檢驗進行檢驗。
SPC圖表用於評估數據點之間隨時間的變化,這是評估全球觸發工具測量的不良事件率的推薦方法。1,13我們使用Excel 2013中的QI宏在u型圖中顯示每1000個患者日的不良事件發生率,在p型圖中顯示兩個樣本的不良事件記錄的計算百分比。14應用特殊原因變異(SCV)的試驗1-3來評估比率。如果數據點在控製限製之外,8個或更多數據點在中位數的同一側或/以及6個數據點在上升或下降,則測試為陽性。我們假設兩個樣本中不同的不良事件發生率會在測試和控製限度方麵產生不同的結果。
為了比較樣本間計算出的不良事件發生率、嚴重程度比例和類別,我們使用廣義線性模型中的泊鬆回歸來計算樣本間不良事件的相對風險作為風險比(RR)。選擇泊鬆回歸是因為它能解釋病例數的變化和住院時間的變化。不良事件數量為因變量,日誌患者天數為偏移變量(在分析每個患者日的不良事件時)。在分析每個記錄的不良事件和發生不良事件的記錄的百分比時,以0為固定值。p值<0.05為有統計學意義。我們還針對與索引服務相關的服務和變量進行了調整。使用Pearson相關和logistic回歸研究不良事件和人口學變量之間的關係。為了評估兩個樣本的評審團隊之間的評分者可靠性,我們使用了κ和加權κ統計量。以下Landis和Koch對Cohen κ係數的解釋是:差(<0.0)、輕微(0.00-0.20)、一般(0.21-0.40)、中等(0.41-0.60)、相當(0.61-0.80)和幾乎完美(0.81-1.00)。15我們使用SPSS (V.22.0;SPSS芝加哥,伊利諾伊州,美國)用於統計分析。
結果
人口統計特征
在這項研究中,使用全球觸發工具共審查了1920份記錄。樣本的人口統計學特征和樣本所取自的總體人口顯示在表1.在大樣本中總共有12%的人群(14267例出院)被複查,而在小樣本中有2%被複查。整個住院期間的住院時間、年齡和性別都得到了推導,這些在大樣本和小樣本之間沒有差異。大樣本中的患者在性別和住院時間方麵與總體人群不同,而小樣本中的患者與總體人群沒有差異。入院類型(急性或計劃)、病例組合(出院診斷)、服務(功能單位)、病例組合指數、手術入院率和轉院次數由出院指數(隨機選擇的來源)得出並進行了調整。
不良事件比較
在包含11367個患者日的1680份記錄的大樣本中,我們在347例出院中確定了447例不良事件。這對應於每1000個患者日發生39.3次不良事件(95% CI 35.8 ~ 43.1, SE=1.86)或每100次出院發生26.6次不良事件(95% CI 24.3 ~ 29.2, SE=1.26)。在大樣本中,出現不良事件的患者比例為20.5%。在240份記錄包括1657個患者日的小樣本中,我們在30例出院中確定了45例不良事件。這對應於每1000個患者日發生27.2例不良事件(95% CI 20.3 ~ 36.4, SE=4.05)或每100次出院發生18.8例不良事件(95% CI 14.0 ~ 25.1, SE=2.80)。出現不良事件的患者比例為12.5%。一些患者經曆了不止一次的不良事件。發生不良事件的患者比未發生不良事件的患者住院時間更長(大樣本r²=0.21,p<0.001,小樣本r²=0.46,p<0.001)。在大樣本中,年齡與不良事件數相關(r²=0.03,p<0.001),而在小樣本中,年齡與不良事件數不相關(r²=−0.003,p=0.54)。
每1000個患者日,大樣本不良事件發生率比小樣本高45% (RR=1.45, 95% CI 1.07 ~ 1.97;p = 0.02)。同樣,大樣本組不良事件發生率比小樣本組高42% (RR=1.42, 95% CI 1.04 ~ 1.93, p=0.03)。大樣本中包括不良事件的記錄百分比比小樣本高65% (RR=1.65, 95% CI 1.14至2.34,p=0.008)。在圖2,兩個樣本中每1000個患者日的不良事件發生率在對照u圖中顯示,在對照p圖中顯示2010年24個雙周期間的不良事件記錄的百分比。在這兩個圖表中,小樣本的控製極限比大樣本要寬得多。scv(試驗1陽性)僅在小樣本中被鑒定出來。這在u型圖上用一個黑點標記出來。這兩種樣品的其他檢測均未呈陽性。
為了調整大樣本記錄選擇前的分層,我們調整了與指標放電相關的變量。主要結果沒有改變,因為在調整這些變量時,大樣本與小樣本相比,每1000個患者天識別不良事件的RR為1.83 (95% CI 1.32至2.54,p<0.001)。
為了評估不同認證過程可能產生的影響,獲得了審查不同樣本集的兩個團隊之間的評級者可靠性。兩個研究小組回顧了一組50例患者的記錄,在不良事件的存在(κ= 0.75)、不良事件的數量(κ=0.68)和嚴重程度(κ=0.69)方麵達成了實質性的一致。
在兩個樣本中,醫院獲得性感染是最常見的不良事件類別。在六個主要不良事件類別的樣本之間,已確定的不良事件的估計比例沒有顯著差異;醫院獲得性感染(RR=1.52, 95% CI 0.94 ~ 2.47, p=0.09)、手術並發症(RR=1.28, 95% CI 0.67 ~ 2.47, p=0.46)、出血/血栓形成(RR=1.44, 95% CI 0.70 ~ 2.98, p=0.33)、藥物損害(RR=1.68, 95% CI 0.60 ~ 4.66, p=0.32)、患者跌倒(RR=0.83, 95% CI 0.24 ~ 2.82, p=0.76)和壓瘡(RR=0.73, 95% CI 0.16 ~ 3.33, p=0.68)(見《醫院感染》)在線補充文件1).對於產科傷害和其他類別,在小樣本中沒有發現不良事件,也沒有進行比較。
最不嚴重的不良事件(E類)占兩個樣本中確定的不良事件的一半以上。在兩個樣本中,包括長時間住院在內的嚴重程度占相同數量(30-40%)。當不良事件按照嚴重程度分別進行分析時,樣本之間每1000個患者日的不良事件發生率無顯著差異:E (RR=1.50, 95% CI 1.00 ~ 2.26, p=0.05)、F (RR=1.68, 95% CI 0.99 ~ 2.85, p=0.05)、F、G、H、I (RR=0.47, 95% CI 0.17 ~ 1.27, p= 0.14)、G、H、I (RR=1.38, 95% CI 0.87 ~ 2.18, p=0.17)。
討論
大樣本不良事件發生率比小樣本高1.45。我們的研究結果表明,樣本量可能會影響不良事件的發生率。CI和SE的差異表明,如預期的那樣,增加樣本量會減少變異。我們認為,較高的不良事件檢出率是由於使用了更大的樣本,並且考慮到醫院的規模,可能更能反映總體人口。由於兩個樣本量的嚴重程度和不良事件類型的分布相同,我們認為這些分布不受樣本量的影響。
雖然全球觸發工具的評估報告了高靈敏度3.可接受的可靠性,16,17在確定不良事件水平時樣本量的影響幾乎沒有被討論過。我們認為,這是首次嚐試評估樣本量對全球觸發工具確定的不良事件發生率的影響。好等10將樣本量調整為醫院規模,不再對同一時間段所選不同樣本量進行進一步比較。我們想評估兩周複查一次的大樣本記錄是否比兩周複查一次的10份記錄產生更高的不良事件發生率。我們的信托增加了我們的雙周樣本,以對應總出院數量的12%,並發現不良事件的發生率高於可比的挪威信托,後者每兩周審查10份記錄的樣本。因此,我們認為,評估使用不同樣本量的全球觸發工具是否會產生不同的結果是合法的、必要的和原創的。
雖然我們的研究結果可能會挑戰為確定準確的不良事件發生率而推薦的小樣本量的敏感性,但它們也強調了樣本量準確反映不良事件嚴重程度和類別分布的能力。在這方麵,我們的結果與其他研究很吻合。18,19在小樣本中,未發現I類不良事件。這很可能是由於全球觸發工具的設計不是為了識別所有此類病例(第一類)。由於它們不經常發生,應使用其他方法來監測這些特定類型的事件,例如,調查所有醫院死亡事件。20.,21因此,我們比較了I類不良事件的發生率與其他類別(F類、G類和H類)的不良事件發生率。
有幾個因素可以解釋兩個樣本中不良事件發生率的差異。首先,兩個示例的身份驗證過程略有不同。為了評估可能的偏差,我們評估了兩個評審不同樣本的團隊的評分者之間的可靠性。我們發現兩個審查小組在不良事件的存在、數量和嚴重程度方麵基本一致,因此得出結論,樣本之間不良事件率的差異很可能不是由於認證過程的微小差異造成的偏見。這些發現得到了Zegers的工作的支持等.22第二,辛普森悖論,這意味著從彙總數據得出的統計結果可能與群體層麵的分析得出的結果不同。23在我們的研究中,與指標流量相關的變量可能存在偏倚,因為大樣本在抽樣前根據服務進行了分層,而小樣本則沒有。然而,當對這些變量進行調整時,主要結果沒有差異。大樣本和小樣本的人口統計學特征性別、年齡和住院時間也沒有差異。第三,該研究僅進行了1年的出院,包括小樣本中的240份記錄。不同樣本量的薈萃分析顯示,不良事件率的變化隨著樣本量的增加而減小,4因此強調了擁有足夠大的樣本量以獲得有效結果的重要性。
結論
我們認為,這項研究的發現可能會對常用抽樣方法的適當性提出挑戰,因為當每兩周複查的記錄數量增加時,不良事件的發生率也會增加,但必須考慮該研究的局限性。不良事件類別和嚴重程度的分布在樣本之間沒有差異,隻有不良事件發生率似乎受到樣本量的影響。需要進一步的研究來確定是否存在最佳樣本量,以及是否應該基於醫院規模,特別是審查更大的樣本量需要更多的資源。在進一步研究之前,我們建議將樣本量相對增加到總放電數量的8-10%。
致謝
作者要感謝Birger Hveding和Inger Lise Øvre,他們與合著者TEH和KM一起進行了審查。弗蘭克·費德裏科和卡羅爾·哈拉登為研究方案的製定提供指導。Tom Wilsgaard在統計分析方麵提供建議,Alexander Ringdal和Marina Mineeva在數據處理方麵提供幫助。
參考文獻
腳注
貢獻者KM和BV設計了這項研究。TEH和KM查閱了記錄。KM進行數據分析,撰寫初稿,並在所有合著者審閱修改後重新撰寫初稿。KM執行統計分析並生成圖表。
資金KM從挪威北部地區衛生局獲得一筆贈款。
相互競爭的利益沒有宣布。
倫理批準諾德蘭醫院信托基金的數據保護官員。挪威區域倫理委員會(參考2012/1691)。
出處和同行評審不是委托;外部同行評審。
數據共享聲明沒有其他數據可用。