條文本
文摘
客觀的每年超過160的000個參與者完成12項牛津髖關節和膝關節評分(羥基/書)作為英國國民健康保險製度的一部分Patient-Reported結果措施(舞會)項目。我們使用現代計算方法,稱為計算機自適應測試(CAT),模擬OHS和書評估、量身定製的目的,減少病人必須完成不影響測量精度的問題。
方法我們符合2018/2019舞會數據項目反應理論(IRT)模型。我們評估紅外熱成像模型的假設與可靠性。我們使用參數從紅外熱成像模型與數據從2017/2018到模擬貓的評估。兩個模擬運行,直到判斷測量SE是滿足(SE = 0.32和SE = 0.45)。我們比較的數量問題需要滿足每個截止和評估全身和貓之間的關係管理。
結果我們進行了紅外熱成像分析使用40 432羥基和44 714書觀察。把羥基和書都是線性的(均方根誤差近似0.08和0.07,分別)和邊際可靠性0.91和0.90。精度限製的貓,SE = 0.32和SE = 0.45,需要一個中間的四個項目(差1)和兩個項目(差1),分別為oh,和中間的四個項目(差2)和兩個項目書(IQR 0)。這是一個潛在的舞會長度減少82%。在160 - 000年度評估的背景下,這些方法可能導致遺漏的每年1 280 000冗餘問題,相當於40 000小時的病人。
結論紅外熱成像的應用羥基和書產生一個高效和顯著降低了貓。我們演示了一個路徑減少負擔,並可能增加這些無處不在的合規措施不影響測量結果的準確性。
- 質量在衛生保健
- 成人骨科
- 臀部
- 膝蓋
數據可用性聲明
所有數據都包含在相關研究文章或作為補充信息上傳。困難和歧視紅外熱成像模型的參數為羥基和書附錄1中是可用的。所有數據都可以從NHS依法可以使用數字和開放政府公共部門的許可證信息。
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
來自Altmetric.com的統計
本研究的優點和局限性
我們的研究是第一個應用程序在世界上最大的計算機自適應測試庫patient-reported結果的措施。
35歲以上000反應被用於每個建模和仿真組。
牛津髖關節和膝關節評分非常廣泛應用在國際層麵上。
這種輔助數據庫分析需要驗證前瞻性收集隊列中。
可用的數據集是有限的,由於磨損,是由於patient-reported結果的鏈接健康記錄測量數據。
介紹
的能力來評估病人的角度來看對他們的健康是全麵的臨床決策的核心,醫學研究和醫療政策建設。1髖關節和膝關節置換手術,病人常常完成問卷叫patient-reported結果措施(舞會)之前和之後的操作。自2009年以來,每年超過160 000名患者接受髖關節或膝關節置換完成舞會NHS英格蘭舞會的計劃的一部分。2
舞會作為這個項目的一部分包括牛津髖關節評分(OHS)和牛津膝關節評分(書),這是使用紙和筆填寫。以外的英國,他們也經常收集的關節成形術注冊在澳大利亞、新西蘭、加拿大和荷蘭。32018/2019的完成率在英格蘭術前一邊書分別為85.7%和86.1%,分別;4然而,在醫院的信任級別,完成率從30%到100%不等。5摩擦時明顯獲得完成術後舞會(完成70%),進一步減少數據的過程是由抄錄分數與健康記錄數字平台和鏈接,這減少了可用的記錄的數量低於50%。4已經認識到舞會問卷收集使用紙和筆英格蘭舞會的計劃是資源密集型的,低效的提供者和繁重的病人。6所需的時間完成骨科舞會被視為一個關鍵障礙,患者和non-completion最高的風險在那些最貧困的五分位數的社會經濟地位和那些貧窮的整體健康。5 7
舞會是由一係列的問題(項目),詢問病人方麵的健康。這些都是得分與結構化的格式給估計連續構造稱為潛在特質(即不能直接觀測到的一個變量)。8潛在的特征在骨科通常包括疼痛和身體功能。羥基和書是使用一個方法論的過程被稱為經典測試理論(CTT),即固定長度的問卷調查得到一個總分,沒有權重或標準化,這估計潛在特質。最近,使用先進的心理技術開發的舞會已經出現。拉希受到最新心理測試結果的影響,建模方法包括分析和項目反應理論(IRT)關注規模內的個別項目,與CTT方法集中在一起所有項目的總分。9校準每一項單獨的能力極大地提高了通用性的舞會。在紅外熱成像模式,有效的測量可以獲得使用任意數量的問題,而在CTT必須管理的每一項的分數被認為是有效的。CTT的另一個限製是,它隻能識別被測項目不相關的構造,它不確定項的冗餘(例如,類似於其他),並能激勵這些冗餘項。10紅外熱成像是利用計算技術的靈活性被稱為計算機自適應測試(CAT)。11一隻貓迭代方法選擇最特定個人信息和相關物品,從而賦予個性評估病人,經常導致減少評估長度,同時保持可接受的精度水平。重要的是,紅外熱成像回顧性分析可以應用於遺留舞會最初設計使用的結論。拉希一邊分析書曾被進行,研究表明改善精度和歧視。12 - 15羥基/書貓的發展可以提高政府的效率和減少行政負擔的舞會項目而提供的機會實現貓以前所未有的規模。
本研究的目的是評估是否應用紅外熱成像和貓一邊書賦予問卷的減少負擔,同時保持精度。
方法
數據
羥基是發達國家在1996年和1998年的書。16日17每個舞會包含12項評估joint-specific症狀在過去4周。每個項目有五個回答選項,年級症狀的嚴重程度和功能限製。發達後采訪關節置換患者被發現是表現最好的condition-specific儀器在測量的標準化比較屬性。18
所有個別項目級別術前一邊書分數從2018/2019中提取數據發布為紅外熱成像模型發展髖關節和膝關節置換手術。第二個示例的仿真貓從2017/2018中提取數據。4原始舞會數據在NHS每年公布的數字平台preopertive和術後鏈接後,健康記錄鏈接,驗證和數據清洗。4
紅外熱成像模型的發展
我們評估了很多失蹤的反應在項目層麵,提出他們的比例不同。我們評估了紅外熱成像的假設unidimensionality,當地獨立和單調性。19確認所有項目測量一個潛在的構造,我們評估unidimensionality使用驗證性因素分析(CFA)。模型適合CFA是評估通過均方根誤差近似(RMSEA)與一組邊界模型適合≤0.08和適合≤0.06,和比較適合指數(CFI)和Tucker-Lewis指數(TLI)與邊緣模型適合> 0.90,適合> 0.95 (R包的lavaan v.0.5 - 23.1097)。20.我們確認每個使用Mokken規模擴展的空間結構和可伸縮性(單調性)的評估項目。這個評估的概率評分項目是否在其症狀的嚴重程度隨規模更高層次的底層結構。Loevinger的H值≥0.3項被認為是可接受的(R包的mokken V.2.8.4)。21
當地項目進行獨立評估,確保所有項目隻涉及測量的主要構造,而不是進一步的獨立結構。這是通過檢查評估剩餘項之間的協方差反應。高殘協方差可能表明項目是無意中測量另一個構造,或者他們可能非常相似,冗餘。這是通過考試的CFA殘留進行相關矩陣與日元的第三季度統計截止設置為兩個項目之間的相關性高於0.2展示本地依賴項。22
確認後的紅外熱成像模型假設,分級響應模型(GRM),這是適當的,當項目反應可以歸類為有序分類,23是適合項目響應數據(R包的mirt V.3.3.2)。這個模型外帶收益率二道菜參數,項目難度的(a)這是一個表示程度的底層構造提供了每一項信息,和歧視(b)閾值,找到響應的類別及其轉換沿著一個連續的尺度。如果項目特征曲線顯示無序閾值,響應類別不符合潛在特質得分,重新排序選項進行相鄰的反應。項目和模型適合評估使用RMSEA, TLI CFI和標準化,均方根殘餘(SRMSR)。紅外熱成像模型中的可靠性估計邊際可靠性的整體可靠性測試是基於平均條件SEs。24整體精度指數與經典的內部一致性(克倫巴赫α)可靠性估計,總部在分數> 0.8表示出色的可靠性。
貓模擬
項目的生產門檻和難度的信息從紅外熱成像模型允許建設的一隻貓。管理一隻貓使用算法,匹配參與者舞會中最豐富的物品一旦達到一個可接受的水平的精度,用可靠性(SE)、潛在特質的估計,不需要進一步的項目。25在一隻貓的模擬,估計潛在特質的長篇舞會可以較短的交付版本選擇特定項。這種模擬可以提供信息的數量物品需要提供潛在特質在預定水平的估計精度。通過仿真,項目,提供最高水平的信息,從而縮短版本最大的效用,可以確定。
我們執行一個貓模擬使用Firestar R (V.1.3.2)。26兩個獨立的模擬進行了羥基和書2017/2018的數據集的預先確定的停止標準(精密)表示作為一個SE的潛在特質估計< 0.32和< 0.45。這些SE值相當於可靠性係數為0.90和0.80,分別。變量來自模擬包括相關(組內相關係數(ICC))之間的潛在特質長篇調查問卷和貓,估計均值和SD,中等和差項目需要得到估計的潛在特質兩個級別的精度。選擇的項目的貓被報道在仿真中使用的比例。不同的項目使用全身和貓之間的管理提出了比例不同。節省時間的長篇和貓之間的政府對估計,計算每一項需要每項10年代和75年代之間完成,一次推斷從發表報告的總完成時間2分鍾到15分鍾的問卷。27
所有的數據分析進行了R (RStudio團隊(2020)。r . RStudio RStudio:集成開發,中國人民銀行、波士頓,馬薩諸塞州)。
公眾和患者參與
正式的病人和公眾參與公共領域數據沒有進行這種分析。全國舞會項目,數據內舉行,已經通過公眾谘詢評估。應對從多個利益相關者評估專家組強調了需要提高數據采集的效率。6
數據可用性聲明
困難和歧視紅外熱成像模型的參數為羥基和書中可用在線補充附錄1。所有數據都可以從NHS依法可以使用數字和開放政府公共部門的許可證信息。
結果
數據集的特點
40 172術前羥基分數和44 264書分數2018/2019的數據,1704年修訂,髖關節置換和1162年修訂膝關節置換被排除在外。進一步排除不完整的問卷調查導致37 995羥基和42 558書觀察。缺少應對項目被發現4118年(0.90%)和4803年(0.93%)乘以羥基和書。雖然前兩個項目幾乎沒有丟失的反應(0.15%的羥基,0.10%的書),其餘10有更多的書氫氧根濃度(1.04%,1.1%),表明可能的病人偏好較短的措施。
髖關節置換手術,59.4%是在女性,93.8%是≥50年和51.9%≥70歲。14.8%的受訪者曾協助完成問卷,症狀持續時間中值為1至5年。膝關節置換,56.5%是在女性,97.4%是≥50年和51.8%≥70歲。14.6%的人協助完成問卷,症狀持續時間中值為1至5年。舞會的人口統計學特征數據集都是相當於整個國家聯合注冊中心。
紅外熱成像模型的假設
unidimensionality的標準是在臨界水平對羥基和書的RMSEA 0.08 (OHS)和0.07(書),CFI 0.93 (OHS)和0.94(書),TFI 0.91 (OHS)和0.93(書)。unidimensionality Mokken縮放證實這一發現和產生的整體可伸縮性係數(H) 0.49(範圍0.41 - -0.58)(OHS)和0.46(0.38 - -0.55)(書)。當地獨立的物品被確認為羥基和書與所有項目的相關性低於0.02。沒有不合群GRM模型內的物品。
無序閾值後生產的紅外熱成像項目特征曲線(曲線所在線由下一個相鄰曲線)指出在項目5、6、9、10和12 OHS和物品4、6和8的書。項目與無序閾值改,讓他們相鄰項的得分與中國相同的區域內它(圖1 a, B)。項目級RMSEA對兩個成績很好,所有項目RMSEA < 0.02 (在線補充附錄1)。羥基的邊際模型的可靠性是0.91和0.90的書。整體模型適合boarderline羥基(RMSEA 0.09, SRMSR 0.05, 0.82和0.90 CFI TLI)和臨界有利於書(RMSEA 0.06, SRMSR 0.04, 0.91和0.94 CFI TLI)。
貓模擬
我們進行了一次模擬貓使用派生的紅外熱成像參數和使用術前羥基和書項反應從2017/2018數據發布的測試集。oh - 36 516名參與者,包括分數,和書45 122。不完整的記錄(即小於12個條目分數)包括紅外熱成像方法占缺失的數據,使用所有可用的回答來獲得最好的估計的潛在特質。SE閾值的0.32(0.9)對應的可靠性,國際刑事法庭全身和貓之間的潛在特質估計是r = 0.96 (OHS)和r = 0.96(書)(圖2)。羥基貓,平均所需的產品數量是3.98 (1.26 SD)的中值4(差1)。書的貓,所需的物品數量的平均值為4.22(標準差1.32)的中值4(差2)(圖3)。
精密SE閾值為0.45(0.8)對應的可靠性,全身和貓之間的一致性模擬略微降低r = 0.90 (OHS)和r = 0.91(書)(圖2)。羥基貓需要平均2.27(標準差0.45)項目,中位數2(差1)。書貓需要2.13(標準差0.45)項目,中位數的2 (IQR 0) (圖3)。
oh,模擬的選擇項8作為所有參與者的啟動項,除非8項不得分。書,項目9是用作盯著項目。總的來說,所有項目整理時,最常使用的物品在0.35 SE貓項目8 (24.9%),11 (21.3%)oh,和項目9(23.5%),11(23.4%)和書12(16.5%),其他項目都是用不到16%的時間。0.45 SE,羥基項目3(19.9%),8(43.7%),11(32.9.0%)在模擬使用最頻繁,四個項目不用於任何模擬,和所有其他物品都用不到3%的時間。書項目,9(46.1%),11(45.7.0%)是使用最頻繁,項目12(5.1%)是最低限度使用留下兩個項目,不需要在任何模擬(包括其中,項目6和8的回答選項已經被確認為無序)和其他所有在不到1.4%的模擬(圖4)(在線補充附錄1)。
最經常使用的物品在評估潛在特質的水平,和選擇項目在模擬開始,項目8羥基(在過去4周飯後…(坐在一個表),曾經是多麼痛苦你從椅子上站起來,因為你的臀部嗎?)和書中的9項(在過去的4周…多少已經從膝蓋疼痛幹擾你通常的工作(包括家務)?)。11項也一直用作書模擬(第二項在過去的4周…你能幫自己家庭購物嗎?)。
潛在的438 192件OHS分數,隻有145 462件使用的是貓在0.32,在980年和82年0.45 SE。這代表了100.3%和136.3%的差異。把整個2018/2019 NJR數據集95年排除之前977全髖關節置換,為0.45,這意味著潛在的節省時間的術前2583 - 19 374小時的分數。潛在的541 464件書分數,隻有190 410件使用的是貓在0.32,在922年和96年0.45 SE,代表100.3%和136.3%的差異。為整個NJR數據集在2018/2019,0.45,這意味著潛在的節省2832.2到21組術前評分241.5小時。
討論
舞會的使用結果的評估髖關節和膝關節置換手術被廣泛接受。最好的舞會的患者,研究人員和臨床醫生很容易理解,無冗餘和心理測量的健壯。在這項研究中,我們應用了現代心理測量方法的一個世界上最大的存儲庫骨科關節成形術舞會。羥基和書符合紅外熱成像假設通過展示unidimensionality,單調性和地方獨立。貓模擬演示的可能性大大降低這些參與舞會的長度兩項在一個高水平的精度。在大規模的數據收集,潛在的節省時間的部署的一隻貓相當於每年一百萬多個冗餘的問卷項目,超過4年的集體病人每年一次。
盡管拉希分析,紅外熱成像的一種方法,曾被應用於羥基和書,13日15迄今為止沒有一項研究探討了使用這些方法來減少的可能性評估使用貓的負擔。貓實現最小化的目標舞會的負擔隻提供最相關和有用的物品需要測量病人的髖關節或膝關節疼痛和功能水平。28模擬內執行本研究能夠減少所需的物品數量67%的羥基和65%書0.32 SE(相當於90%精度)和高達81%的舞會在0.45 SE(80%精度)。比較器,可靠性(作為一個代理的標誌精度)的12項一邊書交付(使用CTT-derived評分係統)的0.82 - -0.94兩次試驗法的刑事法庭。29 30雖然這是優秀的,交付完整的測試不展示優勢貓管理。最小可靠度閾值0.70是普遍接受的舞會,比如那些用在英國NHS舞會項目。SE的可靠性水平是0.55的SD,大致相當於一個0.70的可靠性。31日同樣,0.45的SE(相當於0.80可靠性),在這個模擬中,平均隻有兩個項目被要求估計病人的疼痛和功能,大大減少了患者的負擔。有趣的是,盡管整個舞會的完成率高,在這個示例中,大幅增加的物品non-completion前兩項後,剩餘的10項,然後保持穩定。這是否與項目結構或秩序,或者這是否與羥基和書的方式交付作為全國舞會的計劃的一部分,是不確定的。羥基和書要求的電池的測試在國家舞會規劃,整體27長達八頁的小冊子中問的問題。除了氫氧根和書,問題包括三級EuroQOL 5-Dimension舞會,疾病資料、手術史、症狀持續時間以及人口統計資料。在這個questionairre,存在一些重複和non-completion或部分完成可能與這個數據集的大小。最小化被疲勞隻要問兩個項目可能會提高畢業率的數據收集和縱向,從而優化的實用有價值的數據。32舞會的價值和可靠性大大提高了常規管理隨著時間的推移,這個能力進行有針對性的高度濃縮的舞會,保留其精確估計潛在特質的能力隻能通過紅外熱成像分析和貓。25此外,兩項最常在貓部署用於羥基(項目8和11),被患者認為最清晰和最少的限製。33感興趣的,在兩個舞會,術前物品相關的函數,而不是痛苦,被模擬為最有價值的選擇。
IRT-derived舞會的使用已經變得越來越普遍在努力推進高價值的保健和改善共享決策。34得分的能力在一個簡單的連續體(如0 - 100),得出人口規範(如50分)大大提高病人的理解他們的分數。病人的理解他們的舞會的相關性分數提高符合未來的評估和優化使用舞會作為援助的決定。35使用這種潛在特質無關的連續的舞會還允許比較羥基和書與其他分數評估分數相同的特征。因此,所謂的“過道”可以比較分數來自羥基和書與其他髖關節評分如髖關節殘疾和膝關節損傷和骨關節炎的結果分數,也經曆了紅外熱成像分析,36或時下設計舞會PROMIS等物理功能和疼痛幹擾分數。這個屬性可以產生深遠的影響研究成果的可譯性。最後,IRT-level微分項的分析還開辟了未來評估功能。在這裏,一個勘探程度的項目可能測量不同的能力依賴於變量如年齡、性別、疾病概要文件或操作類型可以進行。
作者認識到這項研究中固有的局限性。我們認識到的維度一邊書可能有爭議的基礎上的結果。它曾被確定單因素和雙因素模型適合這些分數。37 38最常應用的評分方法使用非常普遍的總分舞會,它被認為是適當的保持線性的模型。作者提出另一種方法做承認的得分,有可能失去遺產知識有關牛津分數,為了改善這一風險,我們建議提供一個轉換矩陣允許的紅外熱成像和CTT-based得分。我們也認識到,術前的紅外熱成像參數派生數據,因此,術後的數據需要進一步分析,特別重要的是評估天花板效應在這個修改後的評分指標。我們建議使用IRT-deried參數和完整的可用性問題銀行術後人群,而不是一個特別減少短小精悍的版本。改善interpritability的分數,我們也會推薦IRT-derived最小計算羥基和書的重要區別。才是原作者得分的差異,將被視為相關病人,這將通知該方法的效用試驗設計和潛在兼職溝通和決策。這種分析的力量是非常大的樣本量為紅外熱成像模型建設。貓仿真需要驗證患者的有效性和可接受性的定性、定量分析。的重大限製的實際應用紅外熱成像和貓是一台電腦和一個適當的接口的可用性,我們認識到,目前這個國家計劃通過紙和筆完成收集這些數據和郵政通信。然而,PROMIS係統的利用率在美國強調,這些障礙是可以克服的; furthermore, the increasing ubiquity of tablet and smartphone interfaces and the often-underappreciated technological literacy of this patient population suggest that this problem is far from insurmountable. Both during and in the postpandemic era, remote medicine is becoming the norm; refined PROMs collection has a vital role to play in this process.
結論
髖關節和膝關節結果的收集辦法NHS英格蘭國家舞會計劃已被批評為遠程病人護理。通過應用現代心理分析,世界上最大的存儲庫的髖關節和膝關節患者舞會,我們展示了一個物品的數量需要減少80%估算特定病人的關節疾病在不影響精度的影響。廣泛采用該係統有潛力減少參與者負擔和提高畢業率,從而實現縱向數據的可靠性和效用最大化。
數據可用性聲明
所有數據都包含在相關研究文章或作為補充信息上傳。困難和歧視紅外熱成像模型的參數為羥基和書附錄1中是可用的。所有數據都可以從NHS依法可以使用數字和開放政府公共部門的許可證信息。
倫理語句
病人同意出版
倫理批準
正式的倫理批準並不是必需的。所有數據按照政務公開許可用於公共部門信息。美國國家檔案館。開放政府公共部門的許可證信息。2020年。http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/(2020年12月21日通過)。
引用
補充材料
-
補充數據
僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。
腳注
貢獻者JPE, CG和JMV設計項目。JPE管理與監督和分析結果的數據從CG和JMV。ADT導致了數據管理和解釋。JPE寫的手稿和擔保人。CG, ADT JMV編輯了手稿。所有作者閱讀和批準最終的手稿。
資金JPE在收據的NIHR學術臨床講師獎。作者的觀點是,不一定NHS, NIHR或衛生部和社會關懷。資助者的沒有參與研究設計、數據收集、數據分析、手稿準備或出版物的決定。所有作者都完整的研究數據的訪問,支持出版。
相互競爭的利益沒有宣布。
病人和公眾參與病人和/或公眾沒有參與設計,或行為,或報告,或傳播本研究計劃。
出處和同行評議不是委托;外部同行評議。
補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。