條文本
摘要
目標評價目前用於退行性脊髓型頸椎病(DCM)臨床研究評估的結局指標的測量特性。
設計係統綜述
數據源MEDLINE和EMBASE的搜索截至2020年8月4日。
合格標準以英文發表的主要臨床研究,其主要目的是評估DCM中所使用儀器的測量特性或臨床重要差異。
數據提取與綜合從每項研究中提取心理測量特性和臨床重要差異,評估偏倚風險,並按照健康測量儀器標準選擇的共識標準進行呈現。
結果從1999年至2020年發表的52項研究中確定了29個結果工具。他們測量了神經肌肉功能(16種儀器)、生活影響(5種儀器)、疼痛(5種儀器)和放射評分(5種儀器)。沒有儀器對所有10個測量屬性進行了評估,小於50%的儀器對所有三個領域(即可靠性、有效性和響應性)進行了評估。缺乏高質量的證據。值得注意的是,沒有研究報告結構效度,也沒有討論內容效度的高質量證據。在這種情況下,我們確定了九種可供臨床醫生解釋的工具:手臂和頸部疼痛評分;12項和36項簡短健康調查;日本骨科協會(JOA)評分、改良JOA和JOA脊髓型頸椎病評估問卷;頸部殘疾指數;還有疼痛的視覺模擬量表。 These include six scores with barriers to application and one score with insufficient criterion and construct validity.
結論本綜述彙總了用於評估DCM患者的預後指標的研究。總的來說,需要一套公認的工具來衡量DCM的結果。這些發現將用於開發AO Spine RECODE-DCM的核心測量集。
- 退行性頸椎病
- 脊髓型頸椎病
- 脊髓壓迫
- 結果測量
- 岩心測量裝置
數據可用性聲明
所有與研究相關的數據都包含在文章中或作為補充信息上傳。
這是一篇開放獲取的文章,根據創作共用署名非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此基礎上進行構建,並以不同的條款許可其衍生作品,前提是正確引用原始作品,給予適當的榮譽,任何更改都已注明,並且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
數據來自Altmetric.com
本研究的優勢和局限性
以共識為基礎的報告指南用於評估退行性脊髓型頸椎病測量儀器的特性和臨床重要差異。
本研究隻評估了目前正在使用的儀器。
可解釋性被用作提出建議的一個重要特征,這是一種後驗性,因為沒有關於選擇健康測量儀器(COSMIN)建議的a類共識標準。
可解釋性和可行性評估使用定製的標準,先驗地,從COSMIN方法。
介紹
最常見的成人脊髓疾病,退行性脊髓型頸椎病(DCM),在臨床研究中測量和報道都不一致。1 - 4DCM是一種進行性脊髓疾病,由頸椎退行性改變引起,導致頸脊髓應激和損傷。它通常最初表現為數字靈活性的喪失,輕微的步態障礙和輕微的疼痛,如果不及時治療,可能會導致四肢癱瘓和輪椅依賴。5
2019年,AO Spine發布了退行性頸椎病的研究目標和常見數據元素(AO Spine RECODE-DCM;www.aospine.org/recode)的倡議,旨在創建一個“研究工具包”,以幫助加速知識發現和改善DCM的結果。3個6該倡議確定,需要提高DCM研究中測量和報告的一致性,以便對研究進行比較和/或彙總,並確保捕捉到該疾病最有意義的方麵。7 8這個過程從創建一個基本結果(即核心結果集)和基線特征(即核心數據元素)列表開始。然而,為了真正實現一致的報告,這些數據集應該與核心測量集(CMS)合作:一組商定的工具,用於測量DCM的結果和數據元素。上行線
形成CMS采用了幾種方法,從開發新的測量儀器到采用現有的測量儀器。18 - 20對於AO Spine RECODE-DCM,我們決定推薦現有的儀器,最好是已經在DCM中使用的儀器。這是為了更快地引入CMS,認識到許多新工具正在開發中,CMS可以在未來更新。
因此,我們試圖檢查DCM研究中使用的工具並評估其質量21使用客觀標準。認識到在報告的結果測量中存在質量差異,基於共識的健康測量儀器選擇標準(COSMIN)倡議開發了評估儀器質量的臨床測量工具。22我們檢索了評價COSMIN指南定義的一個或多個心理測量特性的文獻,以及定義臨床重要差異的研究,如最低限度臨床重要差異(MCID)和實質性臨床效益(scb)。使用COSMIN手冊對患者報告的結局指標(PROMs)進行係統回顧,對數據進行評分、彙總和方法偏差評估。第23 - 25這項工作建立在AO Spine RECODE-DCM計劃的協議之上3個6,26並補充了早期兩項對DCM結果測量的綜述。2 21
方法
搜索
開發了一個搜索字符串,以確定評估目前用於DCM臨床研究的儀器的心理測量特性的原始研究。27這包括“心理測量”和“DCM”的同義詞(在線補充表1).搜索是在醫學圖書館員(IK)的監督下開發的,並由先前開發的DCM搜索過濾器提供信息。-從開始到2020年8月4日,使用OVID(荷蘭Wolters Kluwer)對MEDLINE和EMBASE進行了搜索。搜索還集中在先前範圍審查中確定的DCM工具。2 21 30
研究選擇
所有的標題和摘要都由四名審稿人(AYT, AB, ED和FB)根據一套預定義的資格標準獨立篩選。完整的納入和排除標準列於表1。
選擇可能符合條件的研究進行全文分析。如果有多份出版物為同一目的對同一群人進行分析,則使用最近的論文進行評價。在每個階段,兩名審稿人(AYT, AB, ED, FB)獨立審查所有入選的研究,以確保研究選擇的可靠性(在線補充表2).意見分歧通過協商一致或向第三位高級審稿人(BMD)提出申訴來解決。
質量評估
納入研究的質量采用COSMIN偏倚風險檢查表進行評估。第23 - 25簡單地說,COSMIN偏倚風險工具評估了10個測量屬性,包括9個心理測量屬性(即內容效度、結構效度、內部一致性、跨文化效度/測量不變性、信度、測量誤差、標準效度、構念效度和響應性假設檢驗)和臨床重要差異。中給出了定義列表表2。可解釋性和可行性也采用來自COSMIN方法的先驗標準進行評估(在線補充表3和4),分別)。也就是說,通過基於錨點的mcid的可用性來評估每個測量儀器的可解釋性,第23 - 25同時,還就該工具的應用便捷性進行了可行性評估。
每項研究的方法學質量被分為“非常好”、“適當”、“可疑”、“不充分”或“不適用”。然後使用COSMIN偏差風險檢查表中修改的建議分級評估、發展和評估方法對每個屬性進行總體評級。第23 - 25對於每一項研究,一名綜述作者(AYT)評估納入研究的質量、可行性和可解釋性,另一名(BD)檢查評估結果。分歧以協商一致方式解決。
數據提取
一位審稿人(AYT)采用COSMIN的形式提取了以下內容:研究細節、樣本量、患者人口統計學、測量特性以及每種特性的定性和/或定量結果。這是由第二個審稿人(BD)檢查的,任何分歧都通過協商一致解決。定性和定量結果的例子包括觀察(例如,敘述綜合)和統計(例如,相關係數)。這些結果類型是特定於每個測量屬性的,並在COSMIN指南中列出。第23 - 25
數據分析
每個結果都被評為“充分”、“不確定”或“不充分”。所有結果都進行了定性總結,並給出了“充分”、“不確定”、“不一致”或“不充分”的總體評級。這些等級的定義可在COSMIN指南中找到。第23 - 25測量儀器分為三個推薦組:
具有足夠內容有效性的證據和至少具有足夠內部一致性的低質量證據的工具。
不屬於1或3類的儀器。
有高質量證據證明測量特性不充分的儀器。第23 - 25
對每項文書的建議連同可解釋性和可行性評估一起提出,並作為敘述綜合報告。31在撰寫報告時,我們使用了係統評價和元分析首選報告項目清單。32
患者和公眾參與
該項目是一個名為AO Spine RECODE-DCM的大型國際多方合作項目的一部分,該項目旨在開發一個框架來加速知識發現,從而改善DCM的結果。因此,患者和公眾參與了它的整體設計、實施、管理和傳播,並得到了本文作者的認可。有關詳情,請參閱www.aospine.org/recode。
結果
研究屬性
納入的52項研究評估了全球共7395例患者(女性:3217例,男性:4178例),使用29種儀器(表3).根據DCM核心結果集,這些被分為四個領域33:神經肌肉功能、生活影響、疼痛和放射評分。
內容效度
僅對三種測量工具進行內容效度評估:JOA頸椎病評估問卷(JOACMEQ)、改良JOA (mJOA)評分和伯格平衡量表(BBS) (在線補充表5).然而,由於用於評估可理解性的方法的不確定性,以及證據的質量非常低,對內容有效性的總體評級是不確定的。
結構效度
沒有評估工具的結構有效性。
內部一致性
評估了10種測量儀器的內部一致性,包括JOACMEQ、JOA、mJOA、12項簡短健康調查(SF-12)和SF-36 (在線補充表6).由於結構效度是解釋內部一致性所必需的,鑒於上述缺乏對結構效度的研究,內部一致性的總體評分是不確定的。
跨文化的有效性
僅對三種測量儀器進行了跨文化效度評估:JOACMEQ、JOA和mJOA (在線補充表7).由於缺乏多組因素分析和差異項目功能分析,總體評分是不確定的。由於用於分析數據的方法不確定,證據的質量也很低。
可靠性
評估了17種測量儀器的可靠性,包括JOACMEQ、JOA和mJOA (在線補充表8).報告的信度測量為測試-重測信度、觀察者內信度和觀察者間信度。由於(1)不精確(樣本量<100),(2)嚴重不一致和/或(c)嚴重偏倚風險,沒有儀器獲得足夠或不充分可靠的高質量證據。
測量誤差
評估了9種儀器的測量誤差,包括JOACMEQ、JOA、mJOA、NDI、SF-36和疼痛視覺模擬量表(VAS) (在線補充表9))。報告的誤差測量是最小可檢測變化和基於分布的MCID。第23 - 25 34mJOA是獲得高質量充分性證據的唯一評分(基於分布的MCID範圍:1.2-1.4,總樣本量:868)。由於結果不一致,大多數其他工具的證據質量無法評定。
效標效度
評估了12種測量儀器的標準效度,包括JOACMEQ、JOA、mJOA、NDI和SF-36 (在線補充表10).mJOA和患者衍生版本的mJOA (P-mJOA)作為整個量表都獲得了足夠的標準效度的高質量證據。然而,mJOA的四個項目中的三個,以及10秒步測試和腳敲擊測試,獲得了標準效度不足的高質量證據(即,這些子域缺乏作為單獨測量的標準效度)。由於(1)不精確(即樣本量<100)或(b)設計或統計方法中的重要方法學缺陷,其餘大多數儀器的證據質量不高。
建構效度
評估了16種測量儀器的結構效度,包括JOACMEQ、JOA、mJOA、NDI、臂頸疼痛評分和SF-12 (在線補充表11).其中,16個中有8個獲得了足夠的結構效度的高質量證據;其中包括NDI、手臂和頸部疼痛評分以及SF-12。兩種工具在結構效度不足的情況下獲得了高質量的證據。值得注意的是,mJOA同時具有高質量的充分性和不足性,這取決於比較器工具(例如,關於NDI和SF-36的充分性,以及關於30米行走測試(30MWT)和EuroQol-5維度(EQ-5D)的不足)。雖然所采用的設計和統計方法足以解決所提出的研究問題,但由於不精確(即樣本量<100),大多數剩餘工具的證據質量從“低”到“中等”不等。重要的是,隻有一項研究提出了一個先驗假設。35
響應性
評估了16種測量儀器的響應性,包括JOACMEQ、JOA、mJOA、NDI、SF-12和SF-36 (在線補充表12).mJOA是獲得足夠響應性的高質量證據的唯一評分(效應量範圍:0.87-1.0,總樣本量:352)。另一方麵,30MWT是獲得反應性不足的高質量證據的唯一評分(標準化反應平均值:0.3,總樣本量:484)。由於(1)不精確(即樣本量<100)和(b)統計方法的不確定性,其餘大多數工具的證據質量從“非常低”到“中等”不等。
臨床重要差異
對10種測量儀器進行臨床重要差異評估,包括JOACMEQ、JOA、mJOA、NDI、臂頸疼痛評分、SF-12、SF-36和疼痛VAS (在線補充表3).其中,10個中有7個達到了足夠的評級,包括JOACMEQ, JOA, mJOA, NDI和SF-36。MCID的評估隻接受基於錨的測量方法。第23 - 25》
可解釋性和可行性
可解釋性和可行性的描述采用了COSMIN方法學中的標準(在線補充表3和4分別)。可解釋性概括為臨床醫生對評分或評分變化賦予定性意義的程度(即臨床重要差異),而可行性則描述為測量儀器的應用便利性。對於大多數結果測量,沒有發現或發現最小的應用障礙(表4).然而,由於沒有基於錨點的mcid,有9種儀器被認為是不可解釋的。第23 - 25
建議
沒有A類建議,因為沒有測量儀器有足夠的證據證明內容效度(表4和圖2).此外,由於標準效度、結構效度和/或響應性不足的高質量證據的可用性,推薦5種儀器為C類。大多數儀器被歸為B類,因為大多數測量特性明顯缺乏高質量的證據。
鑒於這些結果,並考慮到(1)COSMIN框架的非常嚴格的質量標準和(2)A類證據的缺乏並不等同於低質量證據的存在,我們建議最適合使用的儀器應該是臨床醫生可以解釋的,並為臨床醫生或有DCM生活經驗的人提供定性意義(即,他們應該有臨床重要差異的可用評估)。為此,本文介紹了九種可解釋儀器的測量特性表5:臂頸疼痛評分;SF-12和SF-36;JOA, mJOA和JOACMEQ;抗利尿;疼痛的VAS。其中包括一個標準和結構效度不足的分數(即mJOA)和六個應用障礙的分數。
討論
DCM在臨床試驗中的測量和報告不一致。1 - 4針對這些不一致,AO Spine推出了RECODE-DCM (www.aospine.org/recode),目的是創建一個“研究工具包”,幫助加速知識發現和改善DCM的結果。RECODE-DCM計劃的目標之一是開發CMS。3個6,26根據COSMIN標準,通過識別在DCM研究中使用的工具並檢查其質量,這一係統綜述是構建CMS的第一步。第23 - 25
總的來說,我們確定了29種儀器,其中至少有十分之一的測量特性被評估(圖2);然而,沒有人對所有10個屬性進行評估,小於50%的人在每個測量領域評估了一個以上的屬性(即信度、效度和響應性)(表2).我們還注意到評估DCM儀器的研究在數量和質量上的缺乏;這可以從A類建議的缺失和大多數工具在B類(表4).考慮到COSMIN標準的嚴格性以及A類證據的缺乏並不等同於低質量證據的存在,我們提出了9種對臨床醫生來說似乎可解釋的工具,並似乎為臨床醫生和有DCM生活經驗的人提供了定性意義。這些儀器是SF-12和SF-36;JOA, mJOA和JOACMEQ;抗利尿;疼痛的VAS (表5).
由於缺乏高質量的證據,大多數結果獲得了b類推薦,這一事實並不令人意外。在本綜述中,根據COSMIN指南,低質量證據的最常見原因是(1)研究設計或統計方法中的重要方法學缺陷,(2)用於分析數據的方法的不確定性,以及(3)由於樣本量低於推薦的冪和顯著性水平而導致的不精確性。COSMIN標準的嚴密性(或嚴格性)可能由於某些標準的高度特異性和對DCM背景下心理測量專業知識的期望而強調了這些局限性。例如,如果沒有至少低質量的結構有效性證據,內部一致性的結果必須被評為“不確定”。在本綜述中沒有這樣的研究,可能是因為這是一個較新的和複雜的標準,或者因為搜索或選擇標準。同樣,如果沒有患者焦點小組或訪談的錄音/逐字記錄,關於內容效度的研究得分不能高於“不充分”。同樣,如果使用皮爾遜或斯皮爾曼相關係數以外的統計數據,可靠性分析的得分不能高於“懷疑”。這些可接受的閾值可能解釋了一些缺乏的信息,並且是儀器進入DCM研究的一個重要的入門挑戰,DCM研究是一個具有實際經驗的利益相關者的常規參與處於早期階段的領域,3 8不一致的研究報告很普遍,2 4很少有研究涉及>100例患者,並且在測量文獻的可用性方麵存在偏差(即,使用一些工具,如SF-12,是因為它們是唯一可用的工具,因此由於其常規使用,具有可用的文獻)。然而,從這些COSMIN標準在其他研究領域的應用來看,這些方法上的缺陷似乎並不僅限於DCM儀器,包括目前使用的儀器。40-42因此,缺乏高質量的評估並不一定意味著(1)確定的結果測量一般不充分,或(b) COSMIN標準不適合DCM的背景。
測量的嚴密性是普遍重要的,在DCM中,尤其相關,因為新儀器的開發是十大研究重點。這一排名加強了指導委員會的決定,即根據現有的工具而不是正在開發的工具製定最初的CMS建議。26這一決定是認識到CMS的成功需要廣泛采用,並且在沒有利益相關者意識、熟悉和/或信心的情況下,臨床建議的采用可能具有挑戰性。43-46我們假設,在這個階段,要求全球領域與新的創新保持一致將更具挑戰性,而且還為時過早。因此,對於DCM CMS的第一次迭代,將重點放在學術使用中的當前儀器上。雖然目前很少有符合COSMIN方法設置的標準,但使用我們的事後閾值,有9個合理的候選對象(表5).最終,CMS過程將需要大量依賴協商一致意見階段參與者的專業知識,以便提出在方法上嚴謹並具有實際經驗的代表的最終建議。
盡管設計嚴謹,但這一係統綜述仍有局限性。在搜索現有工具時,我們既沒有確定也沒有評估正在開發的工具,也沒有確定或評估目前正在翻譯為臨床或研究環境或以英語以外的語言出版的工具。然而,就DCM儀器目前正在使用的程度而言,本文隻從RECODE-DCM的最小數據集中確定了六個核心領域中的四個領域的工具,33並且沒有將疾病的結構作為評估結果的一個因素。對於那些缺失的結果,將在未來進行重點範圍審查(由將單獨發表的差距分析提供信息)。接下來,使用與PROMs完全相同的方法分析臨床醫生報告的結果測量和基於績效的結果測量。雖然COSMIN明確允許這樣做,第23 - 25方法可以不同地適應這些不同的儀器類型;出於謹慎和一致性,我們選擇不這樣做,這些工具組的結果應相應解釋。可行性和可解釋性也使用定製標準進行了評估,盡管該標準改編自COSMIN方法,但可能無法準確衡量所有標準。重要的是,我們將臨床可解釋儀器列入候選名單的決定是事後做出的,因為出人意料地沒有a類推薦。這一決定是由我們的判斷決定的,CMS中的儀器應該由臨床醫生解釋,並為臨床醫生和有生活經驗的人提供定性的意義。雖然COSMIN分類法確實將可解釋性分類為一個重要的獨立特征,第23 - 25上述候選名單可能不可避免地代表了一種定位偏見。值得注意的是,不同版本的測量儀器(如mJOA)的一些細微差別沒有得到廣泛評估。47最後,正如這篇評論中經常出現的情況一樣,40-42所有作者都沒有接受過測量理論方麵的專門培訓,因此,這項工作代表了我們在DCM背景下實施COSMIN方法學提出的指導方針和標準的最佳嚐試。
結論
目前,DCM中使用的任何測量儀器都沒有足夠的證據滿足COSMIN標準,可以強烈推薦使用。然而,有一些主要的競爭者似乎為臨床醫生和有DCM生活經驗的人提供了定性的意義;即SF-12和SF-36;JOA, mJOA和JOACMEQ;抗利尿;疼痛的VAS。本綜述的結果將為形成DCM CMS的共識過程提供信息。由於開發新的DCM評估方法是一個積極的研究重點,因此對COSMIN框架的更多認識與DCM研究人員有關。
數據可用性聲明
所有與研究相關的數據都包含在文章中或作為補充信息上傳。
倫理語句
患者發表同意書
倫理批準
這項研究不涉及人類參與者。
致謝
我們感謝Isla Khun對係統搜索的協助,以及所有建議並將繼續建議AO Spine RECODE-DCM計劃的患者。
參考文獻
補充材料
-
補充數據
此網頁文件由BMJ出版集團從作者提供的電子文件製作而成,並沒有對內容進行編輯。
腳注
推特@AYanezTouzet, @angusgkmcnair
貢獻者BD負責構思這篇文章,是擔保人。KSL進行搜索,AYT, AB, ED和FB進行篩選。AYT和BD對數據進行了提取和分析,並撰寫了手稿。AYT, JCF, MGF, JSH, CMZ, RR-P, JM, ES, AC, VR-M, BA, TFB, LT, RC, JDG, SK-R, AGKM, MK和BD對手稿進行了批判性評價。所有作者都對手稿進行了嚴格的修改和認可。
資金這項工作得到了AO脊柱通過AO脊髓損傷知識論壇的支持,這是一個由國際脊髓損傷專家組成的重點小組。AO脊柱是AO基金會的臨床部門,這是一個獨立的醫學指導非營利組織。研究支持直接通過AO脊柱研究部提供。獎項/資助編號不適用。
相互競爭的利益沒有宣布。
出處和同行評審不是委托;外部同行評審。
補充材料此內容由作者提供。它沒有經過BMJ出版集團有限公司(BMJ)的審查,也可能沒有經過同行評審。討論的任何意見或建議僅是作者的意見或建議,不被BMJ認可。BMJ不承擔因對內容的任何依賴而產生的所有責任和責任。如果內容包括任何翻譯材料,BMJ不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南、術語、藥品名稱和藥物劑量),並且對因翻譯和改編或其他原因引起的任何錯誤和/或遺漏不負責。