條文本

下載PDF

增加雙周刊的記錄樣本的大小影響結果當使用”全球觸發”軟件嗎?一項觀察性研究回顧記錄評審的兩種不同的樣本大小
  1. Kjersti Mevik1,
  2. 弗朗西斯一個格裏芬2,
  3. Tonje E漢森3,
  4. 艾倫T Deilkas4,
  5. Barthold Vonen5
  1. 1地區患者安全資源中心,Nordland醫院的信任,Bodø、挪威
  2. 2弗蘭格裏芬& Associates公司,海王星,新澤西美國
  3. 3Nordland醫院的信任,Bodø、挪威
  4. 4衛生服務研究中心,阿肯大學醫院,Lørenskog、挪威
  5. 5CMO, Nordland醫院的信任,Bodø、挪威
  6. 6社區醫學研究所,挪威的藝術大學,Tromsø、挪威
  1. 對應到博士Kjersti Mevik;kjersti.mevik在{}nlsh.no

文摘

目標調查的影響增加的樣本記錄了每兩周”全球觸發”軟件方法來確定住院患者的不良事件。

設計回顧性觀察研究。

設置挪威擁有524個床位的綜合醫院的信任。

參與者1920年醫療記錄選擇從1月1日到2010年12月31日。

主要的結果率,不良事件的類型和嚴重程度確定在兩個不同的樣本大小的記錄選為10和70條記錄,每兩周。

結果在大樣本,1.45(95%可信區間1.07到1.97)倍不良事件病人每1000天(39.3病人不良事件/ 1000天)比在小樣本識別病人(27.2不良事件/ 1000天)。院內感染是最常見的不良事件類別的樣本,和不良事件的其他類別的分布沒有顯著差異之間的樣本。不良事件的嚴重性級別分布樣本之間沒有差別。

結論調查表明,類別和嚴重程度的分布並不依賴於樣本量,不良事件的速度。還需要進一步的研究來總結如果最優樣本可能需要調整基於醫院的大小來檢測更準確的不良事件。

  • 定性研究
  • ”全球觸發”軟件
  • 樣本大小

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 樣本相似的年齡、性別和逗留時間的長度。

  • 可預防性的不良事件並不是評估。

  • 隻有兩個樣本大小進行了比較。

  • 的身份驗證方法為每個組樣本事件略有不同,然而,高兩分的複審團隊之間的一致性和可靠性從而不可能影響結果。

介紹

了十多年,相當大的努力一直投資在醫療保健,減少不良事件,導致許多努力識別可靠和有效的工具來測量這些事件。改善醫療保健研究所(IHI)”全球觸發”軟件是一種廣泛使用,被認為是一個有效的工具測量不良事件。1 - 3方法包括審查雙周刊的樣本10從出院病人的記錄隨機選擇列表。兩個非醫師評論者獨立搜索預定義的觸發器可以顯示可能的不良事件。醫生驗證他們的共識不良事件的存在和嚴重性。不良事件確定每兩周時間提供數據的統計過程控製(SPC)圖表用於分析不良事件率隨著時間的推移。然而,提出了擔憂2,4 - 8方法能夠準確的檢測的不良事件率和利率的變化,由於小樣本大小為10記錄雙周刊IHI推薦的方法。

在挪威,所有醫院信托需要由國家衛生當局使用的翻譯版本”全球觸發”軟件審查至少10個記錄不斷選擇和雙周刊為了監測不良事件率在每個醫院的信任,在國家層麵上。910表明,樣本容量應該調整醫院規模和在此基礎上,我們增加了樣本容量信任到七倍所需的健康權威,我們相信這將檢測更準確的不良事件。我們的不良事件率一直高於其他同類信托回顧雙周刊的樣本10記錄,因此我們試圖評估是否較高是由於更大的樣本量。樣本容量對不良事件率的影響尚未驗證據我們所知,從而證明本研究的必要性。

我們的目標是獲得率、類別和嚴重程度的識別不良事件記錄在兩個不同的樣本大小選擇相同的人口每兩周:一個與IHI推薦相對應的樣本和一個示例的七倍。我們提出,增加樣本大小不會產生不同程度的不良事件病人每1000天。

方法

研究設計

這項研究是一個觀察橫斷麵研究包括回顧記錄審查記錄的兩個樣品,分別為1680年和240年(圖1)。

圖1

研究設計的概述。非醫師評論家;評論家A和B,醫生評論家;評論家C和D。

設置

這項研究是在一個擁有524個床位的醫院信任三個Nordland縣的地理位置,挪威北方。兩個樣本選自相同的人口從2010年1月1日至12月31日出院。然而,大樣本第一次放電顯示分層中的九個服務信任然後10記錄選擇5服務和5記錄4服務,分別為每兩周總共有70記錄。小樣本包括10個記錄選擇雙周刊的聚合放電的所有9服務的列表。IHI指南後,記錄被排斥在兩個樣品對於17歲或更年輕的病人,病人主要是為精神病或康複保健,或患者住院時間小於24小時。綜述了整個住院病人包括天服務不僅在索引服務。

批準的這項研究是數據保護官員Nordland醫院信任和由挪威區域倫理委員會(ref 2012/1691)。

記錄審查方法

評審員的培訓後IHI建議,包括理論、實用的複習練習,和彙報會議由經驗豐富的評論家。IHI定義的不良事件,1:“意外造成人身傷害或導致醫療服務,需要額外的監測、治療或住院治療,或導致死亡的都與治療相關的不良事件之前,期間或之後(30天內)指數放電(放電的放電選中列表的服務)包括評估造成醫療不良事件的總數。可預防性識別不良事件並不是評估。

確認不良事件是來自挪威的翻譯分為23個類別11IHI”全球觸發”軟件。這些類別進一步聚合成八個主要類別(即院內感染、手術並發症、出血或血栓形成,患者下降/斷裂,藥物傷害,產科傷害,壓力潰瘍等)。不良事件的嚴重程度分為五個層次(練習)使用定義改編自這些國家協調委員會的用藥錯誤報告和預防指數(NCC MERP):12

  • 類別E:臨時傷害病人,需要幹預

  • 類別F:臨時傷害病人和所需的初始或長期住院

  • 類別G:永久病人傷害

  • 類別H:幹預維持生命所必需的

  • 類別我:病人死亡

兩組樣本的審查過程遵循了IHI方法,1在評論家檢查每個記錄的存在觸發器觸發的標準列表在挪威”全球觸發”軟件翻譯的。觸發器被確認時,檢查文檔表明一個不良事件發生;對於任何不良事件檢測,是否由一個觸發器,一個上麵的八個類別和嚴重程度被分配水平。不良事件的過程驗證兩組樣品之間略有不同。對於小樣本,兩個護士(評論家和評論家B)獨立審查所有的記錄,然後一起達成共識,類別和不良事件的嚴重性。醫生(評論家C)然後驗證他們的發現。認證的審查過程與記錄從大樣本略有不同,每個記錄由一個reviewer-either綜述了護士(審核人)或兩個醫生(評論者C和D)。這三個評論者討論他們的發現,達成共識的現場感,類別和不良事件的嚴重程度確定(圖1)。每個記錄隻有一個審稿人的修改大樣本的審查過程是由於有限的可用資源。

統計分析

人口統計變量的記錄。分類變量與χ樣本之間的比較2測試在連續變量而使用獨立t測試。

SPC圖表是用來評估數據點之間的差異隨著時間的推移,這是一個推薦的方法評估不良事件的利率衡量”全球觸發”軟件。1,13我們在Excel 2013年至今氣宏使用計算的不良事件率在U-charts病人每1000天,與不良事件記錄的百分比計算P-chart兩樣品。14測試1 - 3特殊原因變化(SCV)應用為了評估利率。測試是積極的,如果數據點超出控製範圍,八個或更多的數據點在同一側的中間或/和如果六個數據點要麼是升序或降序。我們假設不同的不良事件率兩個樣品會產生不同的結果的測試和控製限製。

比較利率,計算比例的清規戒律和類別之間的不良事件樣本,采用泊鬆回歸在廣義線性模型計算相對風險樣本之間的不良事件的風險率(RR)。泊鬆回歸被選中,因為它占的數量變化情況下檢查和保持的長度的變化。不良事件的數量設置為因變量,記錄病人的日子作為偏移量變量(不良事件的分析每個病人一天)。在分析不良事件/記錄和百分比與不良事件的記錄,被設置為固定值為零。p值< 0.05被定義為具有統計學意義。我們也調整了服務和變量與指標相關的服務。不良事件和人口統計學變量之間的關係進行了探討使用皮爾遜′s相關性和邏輯回歸。評估兩分的評審團隊之間的可靠性的兩個樣品,我們使用κ和加權κ統計數據。以下解釋從蘭迪斯和科赫是用於科恩κ係數:可憐的(< 0.0),輕微的(0.00 - -0.20),(0.21 - -0.40),中等(0.41 - -0.60),大(0.61 - -0.80)和幾乎完美的(0.81 - -1.00)。15我們使用SPSS (V.22.0;SPSS芝加哥,伊利諾斯州,美國)進行統計分析。

結果

人口統計特征

綜述了共1920條記錄在這項研究中使用”全球觸發”軟件。人口特征的樣本和樣本來自的總體人口中所示表1。總共12%的總人口(14 267排放)綜述了大樣本,而2%在小樣本了。住院時間、年齡和性別對整個住院和這些沒有大、小樣本之間的差異。病人在大樣本不同的總體人口的性別和長度而病人呆在小樣本沒有不同於整個人口。的招生類型(急性或計劃),病例組合(放電診斷),服務(功能單元),病例組合指數,進入手術和數字傳輸來自索引放電(隨機選擇)的來源和調整。

表1

兩個樣本的人口統計特征和整體人口

不良事件的比較

1680年大樣本記錄包括11 367病人天,我們發現447不良事件在347年的排放。這對應於每1000病人天39.3不良事件的速度(95%可信區間35.8到43.1,SE = 1.86)或26.6每100排放不良事件(95%可信區間24.3到29.2,SE = 1.26)。患者一個不良事件的百分比是大樣本的20.5%。240條記錄的小樣本包括1657名患者的日子裏,我們確定了在30排放45不良事件。這對應於每1000病人天27.2不良事件的速度(95%可信區間20.3到36.4,SE = 4.05)或18.8每100排放不良事件(95%可信區間14.0到25.1,SE = 2.80)。病人不良反應事件的百分比是12.5%。有些病人經曆了一個以上的不良事件。病人出現不良事件住院時間較長(大樣本r²= 0.21, p < 0.001,小樣本r²= 0.46, p < 0.001)患者比其他沒有經曆不良事件。在大樣本的年齡相關(r²= 0.03, p < 0.001),不良事件的數量,而在小樣本年齡不與不良事件的數量(r²=−0.003, p = 0.54)。

不良事件的患者每1000天高出45%的大樣本比小樣本(RR = 1.45, 95%可信區間1.07到1.97;p = 0.02)。同樣,每個記錄不良事件率高出42%的大樣本比小樣本(RR = 1.42, 95%可信區間1.04到1.93,p = 0.03)。記錄包括不良事件的比例高出65%的大樣本比小樣本(RR = 1.65, 95%可信區間1.14到2.34,p = 0.008)。在圖2,每1000病人的不良事件率天在這兩個樣品都在控製U-charts和百分比與不良事件的記錄在控製P-charts 24每兩周時間在2010年。在這兩個圖表,小樣本的控製限製更廣泛的比大樣本。好工程車(積極的測試1)隻被確定為小樣本。這是用在U-chart黑點。沒有其他的測試呈陽性的樣本。

圖2

統計過程控製圖的比較(U-chart)和(P-chart)大型和小型樣品。虛線=上控製限製;虛線=低控製的限製。

為分層調整前大樣本選擇的記錄,我們調整了相關的變量的指數放電。主要結果並沒有改變RR為1.83 (95% CI 1.32 - 2.54, p < 0.001)識別不良事件的患者每1000天在大樣本相對於小樣本調整為這些變量。

兩隊的兩分的可靠性,回顧了不同的樣本得到的評估可能影響不同的身份驗證過程。兩個審查小組審查一組50個病人的記錄,和協議有關的不良事件(κ= 0.75),不良事件(κ= 0.68)的數量和嚴重性級別(κ= 0.69)是顯著的。

院內感染是最常見的一類標識不良事件在兩個樣本。估計沒有明顯差異的比例確定樣本之間的不良事件為六個主要類別的不良事件;院內感染(RR = 1.52, 95%可信區間0.94到2.47,p = 0.09),手術並發症(RR = 1.28, 95%可信區間0.67到2.47,p = 0.46),出血或血栓形成(RR = 1.44, 95%可信區間0.70到2.98,p = 0.33),藥物傷害(RR = 1.68, 95%可信區間0.60到4.66,p = 0.32),病人下降(RR = 0.83, 95%可信區間0.24到2.82,p = 0.76)和壓力潰瘍(RR = 0.73, 95%可信區間0.16到3.33,p = 0.68)(見在線補充文件1)。和其他類別的產科傷害,沒有發現不良事件在小樣本和比較沒有執行。

最嚴重的不良事件(E)級占超過一半的不良事件在樣品確認。嚴重性級別包括長期保持相同數量占樣本(30 - 40%)。之間沒有顯著差異被發現不良事件的患者每1000天之間的樣本,不良事件分析時分別根據不良事件的嚴重程度:E (RR = 1.50, 95%可信區間1.00到2.26,p = 0.05)和F (RR = 1.68, 95%可信區間0.99到2.85,p = 0.05)和F, G, H和我(RR = 0.47, 95%可信區間0.17到1.27,p = 0.14)和G, H和我(RR = 1.38, 95%可信區間0.87到2.18,p = 0.17)。

討論

不良事件率高出1.45大樣本的小樣本。我們的研究結果表明,樣本大小可能會影響識別不良事件。CI和SE的差異表明,增加樣本量減少變異,如預期。我們相信更高的不良事件檢測是由於使用更大的樣本和總人口的可能更反映醫院的大小。因為不良事件的嚴重性級別和類型的分布在兩個樣本大小是相同的,我們建議這些分布受到樣本容量的影響。

雖然評估”全球觸發”軟件已經報告了高靈敏度3可接受的可靠性,16,17樣本大小的影響在決定不良事件的程度幾乎沒有討論。我們相信這是第一次嚐試評估樣本大小的影響,不良事件率與”全球觸發”軟件。好10調整到醫院樣本量大小沒有進一步比較不同樣本大小選擇在同一時期內。我們想要評估是否更大樣本的記錄了每兩周可能產生的不良事件率高於10的樣本記錄了每兩周。我們的信任增加了我們的雙周刊樣本對應總數的12%放電,發現較高的不良事件比挪威信托,回顧了10個樣品記錄每兩周。因此我們確定合理的,必要的,原來的評估是否使用與不同的樣本大小的”全球觸發”軟件將產生不同的結果。

雖然我們的發現可能挑戰推薦小樣本量的敏感性以確定準確的不良事件,他們也強調的能力,樣本大小來反映分布不良事件的嚴重性和類別的準確。我們的結果在這方麵,對應與其他研究。18,19在小樣本,我確認沒有不良事件的類別。這最有可能是由於這樣的事實,”全球觸發”軟件不是為了識別所有這種情況下(類別I)。由於他們的偶然發生,應該使用其他方法來監控這些特定類型的事件,例如,調查所有醫院死亡。20.,21因此,我們比較了類別的不良事件率我連同其他類別的不良事件率(類別F, G, H)。

幾個因素可以解釋不良事件率的差異在兩個樣品確認。首先,兩個樣品的驗證流程略有不同。評估可能的偏見,我們兩隊的兩分的可靠性評估,回顧了不同的樣品。我們發現實質性的協議對於存在兩個評審小組,數量和嚴重性級別的不良事件,從而得出結論:不良事件率的差異之間的樣品很可能不是因為偏見的輕微差異驗證過程。這些發現支持席格斯的作品22第二,辛普森悖論,這意味著從聚合數據統計結果可以給不同的結果從一個組級別的分析。23關於變量的偏態與索引相關的排放可能會出現在我們的研究中,根據服務的大樣本分層抽樣和小樣本不是之前。然而,主要的結果調整為這些變量時沒有差別。人口特征也沒有性別、年齡和長度的大、小樣本之間的不同。第三,研究隻進行了1年的排放包含240條記錄的小樣本。不同的樣本大小的薈萃分析顯示,不良事件率降低的變化隨著樣本量的增加,4因此強調的重要性有一個足夠大的樣本容量為了獲得有效的結果。

結論

我們相信本研究的發現可能挑戰常用的抽樣方法的適當性不良事件增加的速度記錄審查雙周刊的數量增加時,雖然必須考慮該研究的局限性。不良事件類別和嚴重程度水平的分布沒有樣本之間的差異,隻有不良事件的速度似乎是受到樣本容量的影響。還需要進一步的研究來確定是否存在一個最優的樣本大小,如果它應該基於醫院的規模,尤其是在回顧增大樣本量要求更多的資源。直到進一步的研究,我們建議使用一個相對增加樣本量的排放總數的8 - 10%。

確認

作者要感謝birge Hveding和荷蘭國際集團(ing)麗絲Øvre與合作者一起進行了評論和公裏。費德裏科•弗蘭克和卡羅爾Haraden指導研究開發協議。湯姆Wilsgaard統計分析的建議,和亞曆山大Ringdal濱Mineeva求助與數據處理。

引用

腳注

  • 貢獻者公裏,BV設計研究。格蘭和公裏回顧了記錄。公裏進行了數據分析和寫了初稿的手稿和重寫了草案的手稿後所有的合作者都檢查和修正。公裏產生的統計分析和圖表執行的。

  • 資金公裏收到的資助挪威北部地區衛生行政部門。

  • 相互競爭的利益沒有宣布。

  • 倫理批準數據保護官員Nordland醫院的信任。挪威區域倫理委員會(ref) 2012/1691。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據共享聲明沒有額外的數據是可用的。