條文本

手術和侵入性手術在多大程度上比安慰劑反應更有效?對隨機、假對照試驗的係統回顧和meta分析
  1. 韋恩·B·喬納斯1,
  2. 辛迪·克勞馥1,
  3. 露阿娜Colloca2,3.,
  4. 泰德J克4,
  5. 布魯斯·莫斯利5,
  6. 富蘭克林·G·米勒6,
  7. Levente Kriston7,
  8. 克勞斯·林德8,
  9. 卡琳·邁斯納9
  1. 1薩姆厄研究所,弗吉尼亞州亞曆山德裏亞市美國
  2. 2疼痛與轉化症狀科學係,馬裏蘭大學護理學院,馬裏蘭州巴爾的摩市美國
  3. 3.美國麻醉學,馬裏蘭大學醫學院,馬裏蘭州巴爾的摩市美國
  4. 4安慰劑研究項目,波士頓哈佛醫學院貝斯以色列女執事醫療中心,麻薩諸塞州美國
  5. 5衛理公會醫院,休斯頓,德克薩斯州美國
  6. 6的生物倫理學,美國國立衛生研究院臨床中心,馬裏蘭州的貝塞斯達,美國
  7. 7醫學心理學係,漢堡埃本多夫大學醫學中心,漢堡,漢堡、德國
  8. 8慕尼黑工業大學全科醫學研究所,慕尼黑、德國
  9. 9路德維希-馬克西米利安-慕尼黑大學醫學心理學研究所,慕尼黑、德國
  1. 對應到韋恩·B·喬納斯博士;wjonas在}{siib.org

摘要

目標評估手術和侵入性手術的隨機、假對照研究的數量和質量,並評估這些手術的治療特異性和非特異性效果。

設計係統回顧和薈萃分析。

數據源我們搜索了PubMed、EMBASE、CINAHL、CENTRAL (Cochrane圖書館)、PILOTS、psyinfo、DoD生物醫學研究、clinicaltrials.gov、NLM目錄和NIH grant tee出版物數據庫,從它們成立到2015年1月。

研究選擇我們包括隨機對照試驗的手術和侵入性程序穿透皮膚或孔,並有一個平行的假程序進行比較。

數據提取與分析三位作者獨立提取數據並評估偏倚風險。對報告連續結果的研究進行彙總,並使用隨機效應模型計算真實組和假組之間的差異,計算95% ci的標準化平均差異(SMD)。

結果55項研究(3574例患者)符合納入標準;39例為納入主要分析(2902例患者)提供了足夠的數據。治療組/假手術對照組之間持續主要轉歸的總體SMD為0.34 (95% CI 0.20 ~ 0.49;p < 0.00001;我2= 67%)。在疼痛相關疾病中,手術與假手術的SMD差異不顯著(n=15, SMD=0.13, p=0.08),在體重減輕研究中,SMD差異顯著(n=10, SMD=0.52, p=0.05),而在胃食管反流障礙(GERD)研究中(n=5, SMD=0.65, p<0.001)和其他疾病(n=8, SMD=0.44, p=0.004), SMD差異顯著。與積極治療相比,假手術組在疼痛相關疾病(78%)和肥胖(71%)方麵的平均改善要大於GERD(57%)和其他疾病(57%),而在經典手術試驗(21%)中小於內窺鏡試驗(73%)和經皮手術試驗(64%)。

結論外科手術和其他侵入性手術的非特異性影響通常很大。特別是在疼痛相關疾病領域,需要更多來自隨機安慰劑對照試驗的證據,以避免無效治療的繼續。

  • 手術
  • 補充醫學
  • 內科醫學

這是一篇根據創作共用署名非商業性(CC BY-NC 4.0)許可發布的開放獲取文章,該許可允許其他人以非商業性的方式發布、混編、改編、構建本作品,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果您希望重用這篇文章的任何部分或全部,請使用下麵的鏈接,它將帶您訪問版權清除中心的RightsLink服務。您將能夠快速獲得價格和以多種不同方式重用內容的即時許可。

本研究的優勢和局限性

  • 這是第一個使用薈萃分析方法來評估假對照手術試驗中的特異性和非特異性成分,以及這些影響在何種程度上不同於條件和程序的係統綜述。

  • 所有的敏感性分析結果與主要分析結果相似,但有一個例外,即大型研究(≥100例患者)的敏感性分析顯示較小的非顯著效應量。

  • 我們的研究結果對臨床研究和實踐具有啟示意義,反對繼續使用無效的侵入性治療,特別是在慢性疼痛領域。

  • 一個限製可能是,我們的薈萃分析的結論局限於已有的已發表的外科幹預數據,這些數據已在假對照臨床試驗中得到驗證。

簡介

外科手術和其他侵入性手術(如內窺鏡檢查和經皮穿刺手術)在醫學上得到廣泛應用,但它們的具體療效和風險收益情況很少以嚴格和係統的方式進行評估。微創手術的發展擴大了這種幹預的使用範圍,用於治療各種疾病,如腰痛,1關節炎,2子宮內膜異位,3.帕金森病,4gastro-oesophageal回流5和肥胖。6

這些程序很少使用嚴格的研究設計進行評估,包括隨機、分配隱藏和致盲或安慰劑對照,而這些被認為是醫療幹預的金標準。在缺乏對常見偏見來源的控製的情況下,對這些程序的研究可能會對其真正療效產生錯誤的印象。有可能用嚴格的方法測試侵入性程序嗎?盲目的結果評估是具有挑戰性的,因為模仿一個複雜的侵入性程序,如手術,或插入一個範圍或針,需要一個精心設計的假程序。此外,在使用假手術的倫理問題上存在著重大的爭議,即使對知情的患者也是如此,這進一步限製了進行這類研究的數量。7,8然而,在沒有嚴格測試的情況下,我們能證明這些程序的廣泛使用嗎?

通過比較治療組和假手術組的結果,使用盲法和假手術可以對治療效果進行嚴格的評估。具體來說,假手術控製了假手術組中觀察到的各種結果,這些結果與被調查的手術或侵入性手術的具體療效不同。這些“非特異性”結果包括安慰劑反應(有時也稱為安慰劑效應),我們在這裏定義為假手術組中觀察到的結果變化。這些變化是由於病人病情的自然曆史或回歸到平均水平和對醫療儀式的反應。這些儀式包括程序的類型(藥丸、針、刀或觸摸),提供者的地位、權威和溝通風格,治療的環境和背景,以及患者和從業者對結果的期望。9

然而,侵入性手術被認為包含了許多可能導致安慰劑反應的因素,包括使用類似醫院的環境;多個權威的提供者;關於預期結果的頻繁和重複的建議;侵入:對身體的侵入;還有一場精心準備的治療和康複儀式。10因此,在臨床實踐和無假手術對照組的隨機試驗中,手術儀式和其他非特異性因素對觀察到的結果有顯著貢獻。一些高調的研究支持這一假設,其中假手術隻涉及表麵麻醉與更有創的真實手術進行比較。11 - 13例如,莫斯利11據報道,與在不引入關節鏡的情況下在膝蓋上切一個切口的假手術相比,接受關節鏡膝關節手術的骨關節炎患者的疼痛改善沒有更大。最近的兩項關於椎體成形術治療疼痛性骨質疏鬆性椎體骨折的對照研究報告稱,與更有創的主動手術相比,僅采用表麵麻醉的假手術緩解疼痛的程度相似。12,13相比之下,一項比較手術和非手術治療疼痛性骨質疏鬆性椎體骨折的係統綜述得出了椎體成形術和後凸成形術優於非手術治療的結論。14因為侵入性幹預往往比非侵入性治療產生更大的非特異性效果15,16不包括假手術臂的手術試驗可能會給出有偏見的結果。因此,侵入性手術的有效性,例如,對慢性疼痛的治療,仍然存在爭議。17此外,許多侵入性手術涉及麻醉風險和高成本。17因此,評估侵入性手術觀察到的結果在多大程度上是由於治療的特定療效或其他因素是很重要的。

為了更好地理解這些問題,我們對手術和侵入性手術的研究進行了係統回顧和薈萃分析,其中包括一個平行的假手術進行比較。我們的研究目的是:(1)評估此類研究的數量和質量;(2)估計假手術的具體效果的大小;(3)評估手術儀式和其他非特異性因素對這些手術結果的影響。

方法

識別的研究

從創建到2015年1月,我們搜索了以下在線數據庫:PubMed、EMBASE、CINAHL、CENTRAL (Cochrane圖書館)、PILOTS、psyinfo、DoD Biomedical Research、clinicaltrials.gov、NLM目錄以及NIH grant tee Publications數據庫。我們最初使用的搜索詞是:“診斷技術,外科”或“矯形手術”或“專科,外科”或“外科手術”或“外科手術”或“手術”(副標題)或“手術”和(“安慰劑”或“安慰劑效應”或“假手術”或“安慰劑手術”或“模擬手術”或“安慰劑手術”或“假手術”或“模擬手術”或“安慰劑手術”或“假手術”或“模擬手術”或“安慰劑手術”)。我們的研究僅限於人類和隨機對照試驗。這些搜索術語的變化是為MESH術語,在必要時,並可從第一作者的請求。

“灰色文獻”是通過尋找相關的論文、會議論文集、穀歌Scholar和使用關鍵詞方案搜索互聯網,以及搜索所有已識別文章的相關參考文獻列表和相關評論來搜索的。我們還聯係和谘詢了手術和安慰劑領域的領先專家,並分享了這些專家多年來收集的與安慰劑相關的數據庫,以確保我們捕獲了所有相關文獻。

合格標準

納入係統綜述的研究包括:(1)隨機對照試驗;(2)涉及的人群有症狀驅動的醫療狀況,正在進行如下定義的侵入性手術或經典手術;(3)有一個使用假手術來模仿真實手術的對照組。

經典手術被定義為一種遵循典型手術經驗的程序,包括術前準備、麻醉、切口創傷(通常通過肌肉和筋膜進入腹膜)和術後恢複過程。侵入性手術被定義為為操縱組織或改變解剖結構而將器械插入體內(內窺鏡或經皮)。在所有病例中,我們選擇了將這些手術與使用相同手術或侵入性手術、工具和儀式的虛假手術進行比較的研究,但排除了組織操作的假設活性成分。我們排除了那些僅將該過程作為另一種正在進行的積極治療(如起搏器、腦或心髒刺激或藥物或生物製品)的傳遞機製的研究。為預防某種疾病而實施侵入性手術或沒有症狀驅動的疾病的研究也被排除在外。

四名研究者(CC、LC、KL和KM)根據納入標準在兩個階段篩選標題和摘要的相關性:第一階段排除所有明顯不相關的研究,第二階段對其餘研究應用上述所有納入/排除標準。任何關於納入某項研究的分歧都是通過討論和共識解決的,並得到第一作者(WJ)的批準。所有審查員都接受過係統評審方法方麵的充分培訓。每篇引文至少要有兩名審稿人進行審核,才能進入下一階段的審核。兩階段的Cohen’s κ on一致性均在88%以上。

質量評估和數據提取

個體研究的方法學質量(序列生成、分配隱藏)由三位審稿人使用Cochrane偏倚風險(ROB)工具獨立評估。18描述性數據獨立提取以下項目:人口;施行手術的條件;樣本(人口)進入;輟學率;知情同意細節;是否執行並實現了功率計算;幹預和偽程序的使用;主要和次要結果以及與之相關的統計數據;是否報告預期;作者的結論; adverse events reported; funding source, and reviewer comments. We also extracted from each study, if available, a continuous and a dichotomous main outcome at two time points (intermediate and late), and a continuous and a dichotomous pain outcome (when applicable). The most important outcome measure (miOM) was defined as either: (1) the primary main outcome measure (pMOM) at a time point as predefined in the trial; or (if not 1), (2) the only major outcome of a trial at the latest available time point; or (if neither 1 nor 2), (3) the clearly most relevant outcome determined by two independent reviewers at the latest available time point. Secondary outcomes were intermediate time points of the most important outcome measure; pain outcomes at the latest available time point; or, pain outcomes at the intermediate time point. All discrepancies were tracked by the review manager and were resolved by consensus and discussions during team meetings. Data were entered into a web-based, secure, systematic review management programme called Mobius Analytics SRS (Mobius Analytics Inc, Ottawa, Ontario, Canada).

數據綜合與分析

根據我們的分析計劃,元分析關注持續的結果。初步分析是基於臨床試驗報告的最重要的連續結果測量的足夠詳細,以納入元分析。二次分析基於試驗報告(1)在中間時間點的連續結果測量,(2)在後期時間點的疼痛測量,(3)在中間時間點的疼痛測量。僅報告二分結果測量(應答者數據)的試驗在網上有記錄補充表1,並計算了這些結果的敏感性分析(見下文)。

組內和組間效應的大小是基於科恩的19d為一組內的變化,Cohen的d為組間效應測量,分別校正了小樣本偏差。20.為了保持組內和組間設計的效應大小框架一致,從基線的變化貫穿始終。當SD未報告時,它由SD前和SD後計算,21用r=0.5表示前後測量之間的乘積-矩相關性。

采用Cochrane協作網Review Manager軟件(V.5.1)的通用逆方差模塊對連續數據進行分析,使用標準化平均差(SMD)作為效應量度量。由於我們預期異質性,因此使用了隨機效應模型。組內效應值以這樣一種方式彙總:正值表示改善,而組間效應值正值表示幹預組優於對照組(假手術)組。為了估計非特異性結果對治療效果的相對貢獻,我們計算了假手術組和治療組的組內治療效果的合計百分比。我們使用Cochrane 's Q檢驗並計算I2檢驗統計異質性,I分為低、中、高三種2值為25%、50%和75%。22Egger’s檢驗用於評估漏鬥圖的不對稱性。23p值小於0.05作為顯著性水平。24,25

根據預先確定的目標疾病類別和手術類型進行亞組分析。為了檢驗結果的穩健性,我們用四個標準進行了敏感性分析:(1)指定主要結果測量(pMOM)的研究;(2)缺失時,對前後相關係數r分別賦值0.3和0.7;(3)總樣本量≥100的研究;(4)配置隱瞞風險較低的研究。對12項沒有提供連續結果的研究的二分結果進行了額外的敏感性分析補充圖1).

結果

符合條件的研究

我們的搜索共識別出7360個引用。在排除了明顯不相關的參考文獻後,獲得了113篇出版物的全文。其中46例被排除在外,主要原因是不包括儀器或外科幹預或如上定義的假手術。共有55項研究(發表於67篇出版物),涉及3574名納入的患者,符合我們係統回顧的納入標準(圖1).26

圖1

納入研究的流程圖。隨機對照試驗。

納入研究的特點和質量

納入研究的特點在網上有總結補充表1.大約一半(25)的研究是關於疼痛相關的情況,其中背部疼痛(7)是最常見的11,12,27-31其次是關節炎(4),13,尺碼冠心病心絞痛(4);35-39)腹痛(3)40-42子宮內膜異位症(3),43-47cholia (2)48,49和偏頭痛(2)。50,51最常被研究的非疼痛狀態是肥胖,特別是當使用球囊插入時(11)。52 - 62其他有多個研究的疾病包括胃食管反流病(GERD) (5),63 - 67帕金森病(2),68 - 74睡眠呼吸暫停症(2),75,76幹眼病(2)77,78和哮喘(2)。79 - 81其他一些情況也進行了研究(見網上)補充表1).80 - 90許多(22)項研究涉及內窺鏡或經皮手術,其中組織被移除或改變,或材料(如染料、水泥、球囊)被插入。11 - 13,28,31,34,38,40-43,52,54,56,61,63,65,67,77 - 79,90其中一些手術使用導管到達內部器官(如心髒或膽囊),或使用針注射物質或細胞(通常進入腰椎或大腦)。27,29,30.,32,53,55,57,59,60,62,64,66,85,89五項研究評估了用手術刀或鑽開身體的更經典的外科手術。50,51,74 - 76

在大多數研究中,致盲是通過精心設計的假手術實現的。那些模仿傳統外科手術的手術通常會在身體上留下疤痕,但造成的傷害比真正的手術要小。假的經皮和內窺鏡手術通常涉及針或鏡的表麵插入。例如,在帕金森氏症對大腦的外科幹預研究中,假手術包括在不穿透顱骨的情況下打鑽孔。68 - 74子宮內膜異位症的假手術通常需要“診斷性腹腔鏡檢查”,而不破壞內部組織。假球囊插入治療肥胖通常涉及插入球囊,但不充氣。52 - 62

總的來說,除了一些例外,這些研究的偏倚風險很低。在納入係統綜述的55項研究(67篇出版物)中,34項研究(62%)報告了生成分配序列的適當方法,但隻有23項研究(42%)對分配進行了適當的隱藏。48項(87%)研究對患者和結果評估者進行了充分的盲法,52項(95%)研究充分解決了數據不完整的問題。52項(95%)研究沒有選擇性結果報告的暗示,53項研究被判斷為沒有其他偏見來源。

總體分析

39項連續數據研究(2902例患者)納入主要分析。與假手術相比,手術的整體效果非常顯著(SMD為0.34,95% CI為0.20 ~ 0.49;p<0.00001),異質性較大(I2= 67%, p < 0.00001)。不包括一個局外人52減少了我257% (SMD, 0.30, 95% CI 0.17 ~ 0.43;P <0.00001),表明存在中度異質性。敏感性分析提供了可比較的效應大小(圖2),除總體樣本量為100名或以上的研究外,SMD在0.15時不顯著(n=10;95% CI−0.02 ~ 0.32;p = 0.09;我2= 66%)。對漏鬥圖的檢查表明meta分析中存在偏差,如小研究偏倚或發表偏倚(圖3).漏鬥圖的不對稱性由Egger's檢驗(不對稱性係數為1.7,p=0.017)證實。

圖2

侵入性程序和外科手術的具體效果。

圖3

漏鬥圖使用了主薈萃分析中包含的39項研究的連續結果(積極治療vs假手術的效果)。

在一個中間時間點(n=14;SMD 0.12, 95% CI−0.05 ~ 0.29;p = 0.17;我2=54%)以及晚期特定疼痛結局(n=14;SMD 0.12, 95% CI−0.03至0.27;p = 0.11;我2=29%;)或中間時間點(n=8;SMD 0.07, 95% CI−0.06 ~ 0.20;p = 0.31;我2= 0%)。

對最重要的結果指標進行亞組分析

子組的條件

圖4總結了組間變化的SMD和子組均值以及每種情況的95% ci。亞組間總體檢驗差異有統計學意義(χ2=10.26, p=0.04),說明SMD在亞組間存在顯著異質性。納入meta分析的15項研究(分析了1584名患者)調查了疼痛相關疾病,總體SMD在0.13不顯著(95% CI−0.01至0.28;p = 0.08;我2= 46%)。10項研究(287例患者)報道了體重減輕,SMD為0.52,邊際顯著(95% CI 0.01 ~ 1.03;p = 0.05;我2= 76%)。不包括一個局外人52減少了我2至14% (SMD 0.27, 95% CI 0.00至0.55;p = 0.05)。大多數(9項)研究涉及球囊和假球囊插入。5項研究(342例患者)涉及胃食管反流。它們的顯著SMD為0.65 (95% CI為0.31 ~ 1.00;p = 0.0002;我2= 55%)。一項關於帕金森症的研究(34例患者)顯示SMD為0.36 (95% CI−0.37至1.09)。其他疾病的8項研究(655名患者)得出的彙總SMD為0.44 (95% CI 0.14至0.74,p=0.004;我2= 57%)。

圖4

安慰劑組和積極治療組對改善的相對貢獻。

按過程類型的子組

組間SMD在經典手術、內窺鏡手術和經皮手術之間無顯著差異(χ2= 1.10, p = 0.58;結果未顯示)。

兩個結果

12項研究僅提供了二分結果測量(見網上)補充表1).敏感性分析顯示,與假手術相比,手術的整體效果(風險比1.54,95% CI 1.11 ~ 2.15;p=0.01),異質性較大(I2= 59%, p = 0.005)。根據病情的亞組分析顯示,在疼痛研究中,手術與假手術的顯著效果(n=9;風險比1.60,95% CI 1.11 ~ 2.30;p = 0.01;我2=59%, p=0.01),但其他研究沒有(n=3;風險比2.19,95% CI 0.44 ~ 10.84;p = 0.33;我2= 60%, p = 0.08;在網上看到的補充圖1).

假手術組和活動組的基線變化

假手術組與基線相比的合並SMD為0.61 (95% CI 0.47 ~ 0.75, p<0.00001, n=39, I2=76%)和0.92 (95% CI 0.74 ~ 1.09, p<0.00001, n=39, I2=86%)。因此,平均而言,假手術組的變化占治療後整體改善的65%。在疼痛相關疾病(78%)和肥胖(71%)中,特異性到非特異性治療效果的比例大於GERD(57%)和其他疾病(57%),而在經典手術試驗(21%)中顯著小於內窺鏡試驗(73%)和經皮手術試驗(64%;圖4).假手術組的改變占中晚期疼痛結果總體改善的89%和82%。

討論

這是第一個綜合係統的綜述,用meta分析估計了手術和侵入性手術對各種情況的具體影響的程度。雖然一些高調的研究報告稱,治療和假手術之間沒有區別,但我們發現,在分析中包括的侵入性手術中,總體效應大小(Cohen’s d)是積極的,但適度的。當隻進行更大規模的研究(≥100名參與者)時,侵入性手術的特定效應消失,表明目前的證據不強,可以通過更多更好的研究來改變。此外,對於某些條件和程序,非具體影響的貢獻甚至更大。雖然非特異性效應約占所有侵入性治療效果的65%,但在慢性疼痛情況下,非特異性效應占主動治療效果的78%,在肥胖情況下占主動治療效果的71%。這些比例遠遠高於非手術試驗中觀察到的比例,即慢性疼痛的40%和肥胖的33%。91手術試驗中非特異性效應的較高貢獻很可能是安慰劑效應較高的結果。然而,在我們的數據集(和其他數據集)中缺乏無治療組92沒有明確的結論。91我們的亞組分析表明,目前的證據不支持侵入性手術對慢性疼痛的特異性療效(p=0.08),對肥胖的療效接近(p=0.05),但支持這些手術對GERD的療效(p=0.0002)。然而,請注意,二分結果的分析顯示疼痛研究有更大的具體影響(見網上)補充圖1).沒有足夠的數據來對所檢查的其他情況提出建議。

本研究的優勢和不足

這項研究有幾個局限性。首先,本研究的核心優勢和局限性在於,我們彙集了納入研究的效應估計。我們認為這是一種優勢,它允許我們:(1)在假對照手術研究中估計侵入性手術的總體效果,(2)估計目前可用數據對這些手術的具體療效的置信度;並且,(3)實證調查結果在什麼程度上不同的條件和程序。顯然,期望手術在不同條件和結果之間具有相似的特定效果是不合理的,因此我們的亞組估計不應在不考慮幹預措施和結果如何變化的情況下進行臨床解釋。這也被我們的meta分析中中等到較大的異質性所表明,表明效應大小的變化比偶然預期的更多。其次,侵入性手術的全雙盲性比較困難。雖然大多數研究成功地使患者和結果評估者失明,但做這些手術的醫生不可能被蒙蔽。因此,他們有可能向患者傳達了對研究有偏見的信息。普萊斯等人已經證明,即使在口頭交流上有限製,醫生的預期也會影響疼痛的結果。93,94第三,發表偏倚可能會影響我們估計的準確性。眾所周知,陰性研究(在這種情況下,表明真實和假手術之間沒有區別的研究)發表的頻率不如陽性研究。然而,我們的搜索策略是全麵的,研究選擇過程是可靠的。正如上文所述,我們還對灰色文獻進行了徹底的搜索,並獲得了安慰劑研究專家的輸入,增加了捕獲該領域所有研究的可能性。這項活動允許在最後進行交叉檢查,以確保我們為本次綜述捕獲了大多數相關的已發表的隨機對照試驗。我們沒有發現任何未發表的報告,符合我們的納入標準,但有一些出版物不容易通過搜索引擎訪問,我們能夠通過這些方法捕獲。我們對研究質量因素的敏感性分析沒有改變我們的主要發現,除了將分析限製在100名參與者及以上的大型研究,揭示了在0.15 (95% CI−0.02至0.32;p = 0.09)。然而,埃格的漏鬥圖不對稱檢驗表明,在我們的數據集中有一個小的研究偏差。雖然我們對影響大小的綜合估計必須被認為是總體薈萃分析的粗略估計,但它們對疼痛、胃食管反流和肥胖亞組來說是合理的估計。 Meta-analyses of placebo-controlled drug studies in pain, depression, hypertension, ulcer treatment and other areas often report a similar magnitude of specific treatment effects compared to non-specific effects.95 - 98然而,這些研究的樣本量通常要大得多,這增加了他們估計的信心。最後,我們隻發現了一項包括無治療組、積極組和假組的三組研究。67因此,不可能估計與無治療相比,有創治療的儀式和環境對結果的貢獻。尤其是在疼痛和肥胖領域,這樣的三方麵研究似乎對做出良好的循證決策至關重要。

我們的發現與發表在BMJ在2014年。92然而,該研究使用了投票計數,報告55個試驗中74%顯示安慰劑組有所改善,51%報告手術和安慰劑組沒有區別,49%報告手術優於安慰劑組。我們在該研究的基礎上進行了更全麵的文獻搜索和meta分析,這使我們能夠估計手術效果的量級,對當前研究結果的信心,並在各種質量參數、條件、程序和結果中檢驗量級。我們現在可以得出這樣的結論:至少慢性疼痛缺乏明確的證據證明所探索的外科幹預(如經典手術和內窺鏡手術)的有效性。由於這些情況在世界範圍內構成了很高的公共衛生負擔,我們需要獲得使用這些程序的更好證據。此外,很明顯,該領域安慰劑對照試驗的證據總體上是貧乏的。

對實踐、研究和政策的影響

這些結果對實踐、研究和政策有許多啟示。現有假對照試驗的證據表明,對於包括子宮內膜異位症、背痛、關節炎、心絞痛和偏頭痛在內的各種慢性疼痛情況,侵入性手術並不明顯比假手術更有效。有證據支持GERD的外科幹預,而有限的證據支持使用球囊插入治療肥胖。

鑒於大量的侵入性和外科手術正在進行,值得注意的是,我們在文獻中隻能識別出55個假對照研究。當然,並不是所有的侵入性手術都可以進行假對照比較;例如,當結果顯示客觀參數有無可爭辯的變化時,假手術的風險就會過大。然而,考慮到非特異性因素對創傷性手術治療疼痛等疾病的效果有很大影響,在建議對這些疾病廣泛使用它們之前,需要更嚴格的評估。最近一項關於外科醫生對假手術態度的調查可能為開展更多此類研究提供了機會。外科醫生普遍認為,手術幹預中可能存在安慰劑成分。99此外,最近一項係統綜述的結果表明,與虛假手術相關的不良影響的風險很小。92因此,有必要進行更精心設計的假對照手術試驗,以避免繼續使用無效的侵入性治療。

致謝

作者要感謝Samueli研究所的研究助理LaDonna Johnson女士在文章檢索和跟蹤方麵的幫助,以及Viviane Enslein女士在稿件準備方麵的幫助。

參考文獻

補充材料

  • 補充數據

    這個網絡僅文件已由BMJ出版集團從作者提供的電子文件生產(s),並沒有編輯的內容。

腳注

  • 貢獻者WBJ擔任該項目的PI,負責項目的概念和設計、獲得資金、數據的獲取和數據的解釋、文章的起草和最終修訂,以及提交的版本的最終批準。CC作為項目經理和審稿人,參與了係統評審的構思和設計、數據的獲取和數據的分析和解釋、文章的起草和提交版本的審批。LC和KM作為研究質量審稿人,對研究的概念和設計、數據的獲取、數據的分析和解釋、手稿的起草和提交版本的批準都做出了貢獻。此外,KM領導了項目的元分析部分。TJK和FGM擔任主題問題專家,參與數據的概念、設計和解釋,對重要的知識內容進行批判性修改,並批準提交的版本。LK作為該項目的統計專家,參與了meta分析的設計和實施、數據的獲取、數據的分析和解釋,在統計、meta分析技術、稿件結果部分和提交版本的批準方麵對稿件做出了貢獻。KL參與了數據的概念和設計、數據的獲取、數據的分析和解釋、提取數據的元分析技術的設計、幫助起草和修改文章的重要知識內容,並批準提交的版本。

  • 資金該工作由美國陸軍醫學研究和裝備司令部支持,授予號為W81XWH-08-1-0615。本報告中包含的觀點、意見和/或調查結果是作者的觀點,不應被解釋為陸軍的官方立場、政策或決定,除非有其他文件指定。資金來源在研究的設計和實施、數據的收集、分析和解釋,或手稿的準備、審查或批準中沒有任何作用。

  • 相互競爭的利益沒有宣布。

  • 來源和同行評審不是委托;外部同行評議。

  • 數據共享聲明沒有其他數據可用。