條文本
摘要
目的通過標準化程序采集的超聲(US)圖像,評估測量臨床診斷為岡上肌肌腱病(病例)患者和健康參與者(對照組)肌腱結構變化的評分者間可靠性。
方法共納入40名參與者(24名患者),以評估纖顫中斷、新生血管、鈣化物的數量和總長度以及肌腱厚度測量的評分者間可靠性。采用線性加權κ、類內相關性(ICC)、SEM、一致性極限(LOA)和最小可檢測變化(MDC)評價信度。
結果'中度-幾乎完美' κ被發現用於分級纖維斷裂、新生血管和鈣化數量(k 0.60-0.96)。對於鈣化物的總長度和肌腱厚度,掃描電鏡顯示ICC是“極好的”(0.85-0.90)(協議)範圍從0.63到2.94毫米和MDC(集團)範圍從0.28毫米到1.29毫米。總的來說,SEM、LOA和MDC顯示鈣化的變化比肌腱厚度的變化更大。
結論當應用標準化程序測量捕獲的美國圖像和與岡上肌腱病患者相關的電影序列的結構變化時,評分者之間的可靠性為中等到幾乎完美。除了針對金標準(如MRI)進行驗證外,未來的研究應在體內測試該方法在臨床實踐中的內部評分者和內部評分者的可靠性。
試用注冊號NCT01984203;Pre-results。
- 可靠性
- 病變的
- 超聲
這是一篇開放獲取文章,根據創作共用屬性非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此作品的基礎上進行構建,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
數據來自Altmetric.com
本研究的優勢和局限性
提出了一種用於捕捉和測量岡上肌腱結構變化的標準化程序。
提出了分級和解釋肌腱病相關變化的具體程序。
可可靠地進行分級和測量。
該方法在體內的性能保證了該方法在臨床實踐中的有效性。
簡介
肩袖(RC)肌腱病可以被認為是一個連續的病理,建議根據這個連續的階段量身定製康複。1,2在診斷RC肌腱病時,經常使用遺忘和特殊的矯形試驗,但這些試驗往往缺乏高特異性和敏感性,使診斷不確定。3.因此對精確和有針對性的治療提出了挑戰。
灰色(GS)超聲(US)和功率多普勒(PD)可視化RC肌腱可能有助於發現肌腱病變的跡象,如低回聲區、纖維斷裂(FD)、新生血管(NV)、嵌在肌腱內的鈣化(CAs)或水腫,並確認RC肌腱病變的“先驗”假設,提供了令人滿意的US方法的臨床特性。4,5
然而,超聲是一種依賴於操作者的技術,在做出準確診斷之前,需要在性能和評估方麵進行全麵的培訓和經驗,特別是在肌腱病變中經常看到的更細微的變化。6以前,在比較新穎和有經驗的臨床醫生在美國做出的診斷時,發現可靠性較差。7號到9號此外,當對細微的肌腱結構變化,特別是低回聲區域進行分級時,即使在經驗豐富的臨床醫生中,也隻能發現合理的可靠性,因此可靠性不令人滿意。6,8,10 - 12
已知用於捕獲和評估US的標準化程序可提高基於美國的診斷的可靠性。6以前,在肘部、腳踝或膝蓋的肌腱病變患者中,當使用標準化程序測量GS和PD時,肌腱病變的評估被發現是可靠的。4,11
然而,對於肩部,缺乏臨床相關的、標準化的和可靠的方法來評估肌腱病變。由於美國在很大程度上受到臨床醫生經驗和技術的影響,因此需要定義美國圖像和電影捕捉的標準化程序以及評估與肌腱病相關的結構變化的標準化程序。
因此,本研究的目的是評估通過美國標準化程序捕獲的圖像和電影,測量和分級臨床診斷為岡上肌肌腱病患者(病例)和健康參與者(對照組)肌腱結構變化的評分者之間的可靠性。
材料與方法
研究設計
該研究遵循了可重複性研究中的診斷程序方案。13該方案包括一個三相研究設計,包括(1)培訓,(2)總體協議和(3)研究階段(實際可靠性研究;圖1).
這些階段構成了優化程序的方法學模型,旨在盡可能地消除臨床醫生的主觀性。培訓階段的目的是確保評核員有足夠的能力和經驗執行評核程序。總體一致階段是一個擴展的培訓階段,確保評分者之間的係統性偏差最小化,並要求評分者之間至少有80%的一致意見才能進入第三階段。研究階段是對所開發程序的可靠性的最終評估。13
對兩個評分者(評分者A和B)之間的評分者間的可靠性(階段3)進行了測試,以測量和分級美國拍攝的圖像和電影中與肌腱病變相關的結構變化。評級公司A (KGI;物理治療師)有1年的美國肌肉骨骼臨床經驗,評分者B (JH;放射科醫生)有超過15年的美國肌肉骨骼臨床經驗。
圖像捕獲和測量
根據文獻,4,10,11,14日至17日對肌腱病變相關潛在病理結構改變的定義達成共識,包括(1)FD, (2) NV, (3) CA和(4)肌腱厚度(TT)。此後,美國發展了一個標準的美國捕捉協議,包括三個靜態圖像(GS),三個動態電影序列(GS)和一個多普勒電影序列(表1).
其次,基於之前用於測量肘部肌腱病結構變化的量表,4,16FD和NV的兩個順序分級量表被調整用於肩部。19評分範圍從0到4 (FD: 0=正常肌腱;4=部分斷裂,對應於肌腱全層纖維斷裂;NV(0=正常,包括無信號;4=極端,包括多普勒活動在50%以上的感興趣區域,ROI;表2;在網上看到的補充附件).
CA以CA的數量和總長度(mm)進行分析,TT以mm為單位。18
評分員A執行了所有美國圖像和電影序列的捕獲,參與者坐著,肩膀內旋轉,手背側放在骶骨上,肘關節彎曲並向側麵引導,以優化岡上肌腱的可視化。20.
使用GE LOGIQ e B12 (GE Healthcare)和5.0-13.0 MHz線性傳感器進行圖像捕獲。所有的美國掃描都是標準化的,並在13.0 MHz和56%增益下進行GS成像,而PD掃描則在0.41 kHz和56%增益的脈衝重複頻率下進行。製造商推薦的肩部肌肉骨骼成像的其餘參數是預先設定的。
捕獲的圖像和電影序列以唯一標識符標簽存儲在外部硬盤上。在“OsiriX V.5.8.2 32位”(評分器A)和RadiAnt DICOM viewer V.1.9.16(32位;評定等級B)。
在總體協議和研究階段,評分者對彼此的結果和參與者狀態(病例/對照組)進行盲化,圖像和電影在測量前至少存儲21天,以確保評分者A的盲化。
培訓和總體協議階段
在訓練階段,評分者A和B在10名參與者(病例和對照組)身上練習了捕獲、測量和分級捕獲的圖像和電影的美國程序。在20名參與者(10例病例和10個對照組)中進行了總體一致階段,每個參數的總體一致性至少為80%(存在/不存在的二分類變量,CA, NV, FD;在實際信度研究之前,連續變量TT、CA的評分差異不顯著(p>0.05)。
研究第三階段(實際信度研究)
參與者
一般納入標準為:18-65歲;能夠理解丹麥語的口語和書麵語;既往無肩部手術/脫位;頸部/手臂無感覺或運動缺陷;無可疑的競爭性診斷(類風濕關節炎、癌症、神經係統疾病、纖維肌痛、精神疾病)。
病例的納入標準為:納入前臨床診斷為RC肌腱病,目前肩部症狀持續至少3個月;位於上臂近側外側的疼痛(C5皮區)因肩外展而加重;陽性“滿能測試”和/或“工作測試”,和/或疼痛在“抗外旋轉測試”;“霍金斯-肯尼迪檢驗”和/或“尼爾檢驗”陽性;至少有以下一種特征:岡上肌腱的FD、NV、CA(受累側)或側差TT(增加/減少)。21
病例排除標準為疼痛(休息時)超過40毫米(視覺模擬疼痛量表,範圍0-100毫米);雙側肩痛;手臂活動仰角<90°;岡上肌腱全層斷裂(經美國證實);CA垂直距離在5毫米以上(x射線);最近6周內注射過皮質類固醇;肱骨骨折(x線);盂肱骨關節炎的診斷;凍結肩;臨床懷疑唇唇病變; symptomatic osteoarthritis in the acromioclavicular joint; or symptoms from the cervical spine.21
對照組納入標準為最近3個月內無肩部不適,臨床肩部試驗陰性。
作為隨機對照試驗的一部分,病例從丹麥三家醫院的專門肩部單位連續招募。21對照組通過廣告從南丹麥大學運動科學和臨床生物力學係以及利勒貝爾特醫院-維耶勒醫院康複科的工作人員中招募。
納入前獲得參與者的知情同意。
統計數據
線性加權科恩κ (LWk)用於計算排序變量(FD, CA和NV數)的95% ci。首先,應用線性加權(LWk V.1),對應於公式:1−|i−j|/(k−1),其中i和j是行和列的數量,k是可能評級的最大數量。22其次,使用相同的權重(LWk V.2),但限製0級和>級之間的差異加權為0,以考慮區分健康和非健康的能力。
κ解釋為≤0.00=差;0.01 ~ 0.20=輕微;0.21到0.40=公平;0.41 - 0.60=中度;0.61到0.80=基本,0.81到1.00=幾乎完美。23
對於連續變量(TT, CA的總長度),類內相關(ICC;3.1)作為信度的衡量。ICC被解釋為<0.40=差,0.40至0.75=一般到好,>0.75=極好的信度。24計算95%一致限(LOA)的Bland-Altman圖作為TT(左右)和CA總長度的絕對一致度量,並用配對t檢驗檢驗評分者之間的差異。通過Pearson相關係數(r)直觀評估漏鬥效應和係統偏倚。SEM計算為SEM(協議)25將結果外推到潛在評分者的一般人群,並在個體(MDC)上計算最小可檢測變化(MDC)個人)和組(MDC .集團)的水平。26通過計算未配對t檢驗來確定病例與對照組之間TT的潛在切點。
在研究階段,按照之前可靠性研究的建議,采用了40名參與者的樣本量。13
數據在Stata/IC V.14 (2015, Statacorp, College Station, Texas, USA)中進行分析。p值<0.05為顯著。
結果
由於研究設計的原因,除了疼痛和不適外,病例和對照組之間的人口統計學沒有差異(表3).
總體一致性在83%到99%之間,FD、NV和CA的LWk V.1在0.60到0.96之間,k κ有約束(LWk V.2)在0.51到0.98之間變化,代表“中等-幾乎完美”的可靠性(表4).
CA和TT的總長度ICC為0.85 ~ 0.90(優秀),SEM為(協議)範圍從0.63毫米到2.94毫米,MDC(集團)從0.28到1.29毫米和MDC(個人)由1.75毫米至8.15毫米(表5).
測量的TT和CA的總長度無係統評分差異(表5).Bland-Altman圖未顯示漏鬥效應,但左肩TT的差異與增加的平均值之間存在較小的交互作用(r=0.35, p=0.03;圖2).總體而言,CA的LOA比TT的變化更大(表5而且圖2).
病例與對照組TT無顯著差異。
討論
評分者之間的信度研究顯示,使用標準化程序對FD、NV和ca數量進行分級的信度適中至完美。測量CA和TT總長度的評分者間信度很好,MDC表明組水平有微小的可檢測變化,特別是在TT中。
FD和低回聲區
盡管將低回聲區和FD合並為一個量表,但信度仍然隻有中等(LWk分別為0.60和0.51)。然而,這與先前對肌腱病的研究一致,其中對細微變化(“輕度異常”和“正常”)的一致被認為是特別困難的,可能是由於在不同的結構變化和各向異性方麵存在困難。4,6,8,10,11FD分級可能更容易通過活體超聲檢查來解釋,因為檢查人員在評估各向異性存在時更靈活。
Neovascularisation
目前NV的可靠性幾乎是完美的。目前研究中可靠性高的原因可能是NV與預定ROI相關的分級(在NV最多的區域放置5×5 mm的固定框),而不是像之前肘關節病變中那樣,對NV相對於TT或一般肌腱的分級。4,16目前進行的修改是為了提高標準化,以及考慮幹預研究中感興趣的TT之間和內部的變化。
其他研究發現,NV在有症狀肩部的患病率為30-65%,而無症狀肩部的患病率僅為25%。27,28這項研究發現NV的患病率為38%,對照組為0%。在以往的研究中,這種流行率的巨大差異可能是由於不同的人群、PD設置、測量方法和在美國圖像捕獲過程中參與者手臂的位置。本研究將手置於骶骨處,以最大限度地拉伸岡上肌腱,這可能增加了由於新血管血流受限而忽略NV的風險。不同的研究設計使得比較患病率和建立臨床實踐中使用的規範水平變得困難。
鈣化
檢測CA總數的實質性κ與之前的研究一致,4,8但LOA、SEM和MDC在CA的總長度上有較大的變化。這種變化可能是由於美國方法學的問題,例如CA下的陰影可能被錯誤地解釋為FD和/或正常的肌腱結構可能出現高回聲,從而類似於CA,從而導致錯誤分類。然而,CA數量的可靠性較高,這表明測量CA的單個長度和/或少數未發現/錯誤分類的CA會影響CA總長度的一致性。Bland-Altman圖中發現的一個異常值(圖2)表明評分者A和B至少在一個較大的結構變化上存在分歧,由於CA的總體規模較小,患病率較低,這一結構變化對變化產生了相當大的影響。
腱厚度
良好的可靠性,且MDC≤0.33 mm,表明該變量對檢測變化非常敏感,這與之前使用相同方法測量TT的研究一致。18這意味著它可能是評估肌腱特性變化的臨床相關測量,如水腫增加/減少。一些研究發現有症狀和無症狀參與者之間的TT有顯著差異,29,30.這與目前的研究和最近的一項研究形成了對比。18各研究之間存在差異的原因可能是由於使用了不同的TT測量方法、樣本量小、不同的納入標準,或者像本研究一樣,納入了更積極的對照組(從衛生人員中招募),這些對照組的肌腱可能比平均人群更厚。
該研究的一個局限性是可轉移到臨床環境,因為本研究使用的是拍攝圖像和嚴格標準化的程序,這些很少用於臨床環境。在體內,評分者在評估潛在FD解釋中各向異性的存在時會更靈活;此外,當懷疑存在CA或NV時,他們將能夠執行重複的圖像捕獲和測量。可靠性研究使用標準化協議13可能是一個弱點,因為目前美國方法和程序的可靠性可能與臨床環境相比具有欺騙性地高。然而,如果標準化方法在標準化環境中的可靠性較差,則可靠性也被認為較差,並且該方法與臨床環境中的使用不太相關。評分者在不同的DICOM觀眾上測量和分級捕捉的圖像和電影。這是否影響了可靠性是未知的。然而,由於可靠性在大多數變量上被發現是高的,它被認為是不重要的,並模仿臨床實踐。
本研究的優勢在於設計,采用了逐步標準化的程序,以最大限度地減少偏差並增加可靠性。13目前美國圖像和電影捕捉、測量和分級結構變化的標準化預計將提高該方法的可靠性和靈敏度。盡管其中一名評分者在美國的經驗相對較少,但可靠性仍然很高,令人滿意,這表明該方案甚至可以由其他非常有美國經驗的臨床醫生遵循。通過使用捕獲的圖像和電影序列,確保兩個評分者有相同的基礎來解釋可靠性研究。
此外,在計算κ時使用限製權重被認為是重要的,因為能夠在病例和對照之間有所不同。
結論
當應用標準化程序測量捕獲的美國圖像和與岡上肌腱病患者相關的電影序列的結構變化時,評分者之間的可靠性為中等到幾乎完美。除了針對金標準(如MRI)進行驗證外,未來的研究應在體內測試該方法在臨床實踐中的內部評分者和內部評分者的可靠性。
參考文獻
腳注
如有額外的材料可用。如欲瀏覽,請瀏覽本刊網上(http://dx.doi.org/10.1136/bmjopen-2016-011746).
貢獻者KGI、BJ-K、HE和CML構思並設計了研究方案。KGI和BJ-K獲得了項目資金。KGI, BJ-K, JV和JH開發並標準化了超聲程序,並定義了分級量表。JV和JH確保了肩部單位的準入和協調篩選程序。KGI是項目協調員,並執行了包含和美國圖像捕獲。KGI和JH是評級機構。KGI和BJ-K計劃和協調統計分析。KGI進行了統計分析。KGI起草了手稿,BJ-K, JH, JV, HE和CML對手稿做出了貢獻。所有作者都閱讀並批準了最終的手稿。 KGI is the guarantor.
資金丹麥南部地區的研究基金、丹麥風濕病協會和Ryholts基金會資助了這項試驗。
相互競爭的利益沒有宣布。
病人的同意獲得的。
倫理批準在涉及人類參與者的研究中執行的所有程序都符合機構和/或國家研究委員會的道德標準以及1964年赫爾辛基宣言及其後來的修正案或可比的道德標準。丹麥南部區域科學倫理委員會已批準該試驗(項目ID: S-20130071)。
出處和同行評審不是委托;外部同行評審。
數據共享聲明沒有其他數據可用。