條文本

下載PDF

降低強度療法的非劣效性試驗是否顯示效果降低?一個描述性的分析
  1. 斯科特·K Aberegg1
  2. 安德魯·米赫斯12
  3. 馬修·H薩莫雷13.
  1. 1猶他大學鹽湖城猶他州美國
  2. 2布魯克陸軍醫療中心聖安東尼奧德州美國
  3. 3.流行病學鹽湖城退伍軍人事務部醫療保健係統鹽湖城猶他州美國
  1. 對應到Scott K Aberegg博士;scottaberegg在}{gmail.com

摘要

目標確定隊列中的非劣效試驗,其中實驗治療與主動對照比較器相同,但強度降低,並確定這些低強度治療的非劣效試驗是否比隊列中的其他非劣效試驗結果更不利。這樣的發現將在這些試驗中提供生物蠕變的暗示性證據。

設計這項meta研究使用了在5年期間發表在5個最具影響力的通用醫學雜誌上的非自卑試驗隊列。對試驗的特征和結果相關的數據進行了提取。

主要結果測量聲明優勢、非劣勢和點估計傾向於實驗治療的試驗的比例,結果以比例表示的試驗的平均絕對風險差異。

結果我們的搜索得到了163個試驗,報告了182個非自卑比較;31個試驗中的36個比較是相同療法在減弱和充分強度下的比較。與沒有評價降低強度療法的試驗相比,較少的降低強度療法比較顯示出有利的結果(非劣效性或優越性)(58.3%vs82.2%;P=0.002),少數人表現出優越性(2.8%vs18.5%;P = 0.019)。同樣,與其他試驗相比,降低強度療法的點估計更傾向於主動控製(77.8%vs39.7%;P<0.001)和絕對風險差異均值(+2.5% vs - 0.7%;P = 0.018)。

結論在非劣效性試驗中,將一種降低強度的療法與相同的全強度療法進行比較,結果顯示,與其他非劣效性試驗相比,效果有所降低。這表明這些試驗可能有較高的1型錯誤和生物蠕變率,對未來非劣效性試驗的設計和解釋具有重要意義。

  • 臨床試驗
  • bio-creep
  • 假定的安慰劑效應
  • non-inferiority試驗

這是一篇根據創作共用署名非商業性(CC BY-NC 4.0)許可發布的開放獲取文章,該許可允許其他人以非商業性的方式發布、混編、改編、構建本作品,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果您希望重用這篇文章的任何部分或全部,請使用下麵的鏈接,它將帶您訪問版權清除中心的RightsLink服務。您將能夠快速獲得價格和以多種不同方式重用內容的即時許可。

本研究的優勢和局限性

  • 假設驅動和新穎的研究,針對一個主題,有很少的經驗數據。

  • 采用嚴格和透明的方法,采用來自五個影響最大的期刊的非劣效性試驗的橫截麵。

  • 橫斷麵隻代表了所有期刊的一小部分。

簡介

隨著非自卑試驗變得司空見慣,1 2對其有效性的擔憂變得更加重要。3 - 5在一個典型的非劣效性試驗中,一種未知療效的試驗療法與一種主動對照進行比較,而這種主動對照在優越性試驗中已與安慰劑進行比較,並被發現有效。在非劣效試驗中固有的一個假設是,如果一種新的(實驗)療法被宣布不劣於有效的比較器,那麼它將優於安慰劑,如果這一假設在劣效試驗中得到驗證。5個6如果非劣效試驗有很大的非劣效邊際,而結果有利於主動對照,那麼“假定優於安慰劑”可能是不正確的。7 8“假設優於安慰劑”也可能是不正確的情況下,多次迭代的非劣效試驗發生,這種現象稱為“生物蠕變”(見圖1).很少有經驗數據表明,由於假設的優於安慰劑的優勢被侵蝕,被宣布為非劣的療法是否以及多久會降低療效。8 - 10

Diagram showing loss of presumed superiority to placebo with reduced intensity aspirin therapy in a hypothetical sequence of trials. The experimental therapy is on the left in each panel and the control is on the right; point estimates are represented as black ovals with bisecting horizontal lines representing 95% CI—point estimates on the left of the centre line favour the experimental therapy and point estimates on the right favour the active control. In panels 2–6, the vertical dashed line represents the margin of non-inferiority. In panel 1, aspirin 325 mg is superior to placebo control in a superiority trial. In panel 2, reduced dose aspirin at 162 mg as the experimental therapy is compared with full-dose aspirin as active control. The difference favours full-dose aspirin, but the reduced dose meets non-inferiority criteria because the upper bound of the 95% CI does not cross the non-inferiority margin. The dose of aspirin is successively reduced in panels 3–5, with the reduced dose from the previous panel serving as the active control in the subsequent panel. By panel 6, the dose of active control aspirin is 20 mg, and the experimental therapy is aspirin at a dose of 0 mg (ie, placebo) and placebo is non-inferior to aspirin—a highly paradoxical result compared with panel 1 where aspirin was superior to placebo. This result is obtained because in panels 2–6, reduced efficacy of the experimental therapy is concealed in the margin of non-inferiority. This phenomenon has been called ‘biocreep’. ASA, aspirin.
" data-icon-position="" data-hide-link-title="0">圖1
圖1

圖表顯示,在假設的一係列試驗中,降低阿司匹林治療強度後,失去了對安慰劑的推定優勢。在每個麵板中,實驗治療在左邊,控製在右邊;點估計用黑色橢圓形和橫線平分表示95% ci -中心線左側的點估計傾向於實驗治療,右側的點估計傾向於主動控製。在圖2-6中,垂直虛線表示非劣勢的邊界。在優越性試驗中,第1組中325毫克阿司匹林優於安慰劑對照組。在第2組中,作為實驗治療的減少劑量阿司匹林為162 mg,與全劑量阿司匹林作為主動對照進行比較。差異有利於全劑量阿司匹林,但減少劑量符合非劣效性標準,因為95% CI的上限沒有越過非劣效性邊界。在圖3-5中,阿司匹林的劑量依次減少,前一個圖中減少的劑量作為後一個圖中的主動對照。在第6組中,有效對照阿司匹林的劑量是20毫克,而實驗治療是0毫克劑量的阿司匹林(即安慰劑),安慰劑並不低於阿司匹林——與第1組相比,這是一個非常矛盾的結果,第1組中阿司匹林優於安慰劑。之所以得到這個結果,是因為在圖2-6中,實驗治療的降低效果隱藏在非劣效性的邊緣。 This phenomenon has been called ‘biocreep’. ASA, aspirin.

我們最近觀察到,非劣效試驗已被用於比較低強度的治療(根據累積劑量或多方麵治療的一個成分的遺漏)與相同的全強度治療,目的是降低成本或使治療更方便或更少毒性。例如,最近的試驗比較了低劑量組織纖溶酶原激活劑(TPA)和標準劑量TPA治療缺血性中風,從阿黴素中省略了博萊黴素,博萊黴素,長春堿,達卡巴嗪治療淋巴瘤,並測試了間歇性和持續雄激素剝奪治療前列腺癌。11 - 13降低強度療法的非劣效性試驗提供了一個獨特的機會來評估這些試驗中實驗療法推定優於安慰劑的退化。在大多數新型實驗療法的非劣效性試驗中,幾乎沒有證據表明,與主動對照相比,新療法的效果如何——可能更好、相同或更差。由於劑量反應效應,有很好的先驗理由懷疑低強度療法將不如全強度主動對照有效。14如果許多降低強度的療法仍然符合非劣效標準,這將構成暗示性的證據,表明假設的優於安慰劑。迄今為止還沒有這種效應的實證證明。

在最極端的情況下,一個或多個劑量的減少可能導致降低強度的治療,接近安慰劑,但仍然被認為不低於更高的劑量。圖1展示了這是如何發生的。在第一組中,在優勢試驗中,全劑量阿司匹林優於安慰劑。在第二組中,一項非劣效性試驗比較了減少劑量的阿司匹林(作為實驗治療)和全劑量的阿司匹林(作為主動對照),發現減少劑量在數字上而不是統計上更糟糕,CI的上限低於預先指定的非劣效性邊界。在這種情況下,與全劑量阿司匹林相比,減少劑量阿司匹林符合非劣效性標準,盡管減少劑量阿司匹林在統計上有很強的劣效性趨勢。在下一個麵板中,阿司匹林劑量的進一步減少在數字上再次比之前的減少劑量更糟糕,但CI不包括非劣效範圍,它被宣布為非劣效。這一序列在第6組中達到了高潮,實驗療法的劑量被減少到零,使其成為一種安慰劑,其效果不遜於阿司匹林。在這個假設序列中,減少劑量阿司匹林的劣效性在圖2-5的非劣效性邊界內被掩蓋。然而,這個過程不需要重複——在第2組中,隻要減少一次劑量,就會出現一些療效的喪失,從而推定優於安慰劑的情況。這一問題會隨著非劣效性的擴大和治療強度的大幅度降低而加劇。盡管這種被稱為“生物蠕變”的現象可能發生在任何非劣效性試驗中,但由於基本的劑量反應考慮,在低強度療法試驗中發生的可能性似乎更大。

我們編製了一組非劣效性試驗,根據是否將低強度治療與全強度主動對照進行比較,對其進行分類。我們假設,與沒有將降低強度療法作為實驗療法的試驗相比,降低強度療法的試驗將產生更不利的結果(就積分估計和優勢和非劣勢的聲明而言)。我們還想確定在低強度治療的試驗中,非劣效性的邊際是否更保守。

方法

本研究使用的數據集是為非自卑試驗的不同分析而創建的。15.我們在Medline上搜索非劣勢的迭代(例如,非劣勢,非劣勢)16結合medline認可的五種最具影響力的普通醫學期刊名稱(新英格蘭醫學雜誌《柳葉刀》《美國醫學會雜誌》英國醫學雜誌,內科醫學年鑒),通過對2011年6月至2016年10月發表的主要假設的非劣效性檢驗,識別報告前瞻性平行組隨機對照試驗結果的稿件(納入標準)。我們的5年回溯搜索期從2016年6月開始,一直持續到10月底。在分析結果之前,我們選擇了從6月到10月的搜索期間發表的文章,以使數據集盡可能與時俱進。我們審查了結果的摘要和手稿,並排除了那些不符合納入標準的,那些使用聚類隨機設計或貝葉斯方法的,那些沒有使用主動對照的(例如,食品和藥物管理局授權的比較新療法與安慰劑的安全性試驗),以及那些報告的數據不完整或無法總結的。我們將與設計參數和結果相關的數據提取成標準化表格。如果新療法使用與對照劑完全相同的藥物,但劑量、持續時間、相同劑量下給藥間隔增加,或去除多組分主動對照中的一個或多個成分,我們將試驗分類為測試降低強度療法。我們用冗餘方法多次交叉檢查數據,以確保準確性,一位作者(AMH)檢查了10%的數據隨機樣本的準確性,並沒有發現錯誤。

我們使用試驗的原始數據計算所有結果的雙麵95% ci,並根據試驗報告綜合標準(CONSORT)建議對它們進行分類。17我們選擇這樣做是為了使結果的呈現標準化圖1的CONSORT語句。17 18如果一項試驗的結果符合CONSORT聲明的非劣性(95% CI的上限排除了預先指定的非劣性邊界)和/或優性(95% CI的上限排除了零差異),我們將其編碼為有利的試驗結果。對於將主要結果報告為風險度量(如HR、OR或相對風險)的試驗,我們計算了主要結果的絕對風險差,以用於定量分析。19對於報告了多個主要結果的試驗,我們認為手稿中提到的第一個結果是主要結果。對於在獨立組中進行多重幹預(例如,同一種藥物的多劑量)的試驗,我們認為這是獨立的非劣效比較。我們使用χ2以及學生t檢驗。所有描述性統計和分析均采用STATA V.14進行。

結果

圖2顯示了我們搜索策略的結果。在406個獨立試驗的403份手稿中,有198份因不符合納入標準而被排除在外,45份因不符合納入標準或排除標準而被排除在外。剩下的160份手稿報告了163次試驗和182次非自卑比較。

圖2

顯示試驗選擇的流程圖。

表1顯示了試驗的基本特征。兩種影響最大的期刊(新英格蘭醫學雜誌而且《柳葉刀》)發表了127項(78%)試驗。四個專業方向占試驗的一半以上:傳染病、血液學/腫瘤學、心髒病學和肺/危重症護理表1).

表1

163例納入試驗的特征

有31個試驗和36個比較降低強度治療作為實驗治療和全強度主動對照。這些試驗的選擇和他們評估的療法列在表2.這些比較的有利結果(非劣性或優越性的確定)比例為58.3% (95% CI 41%至74%),而未檢測降低強度治療的比較的82.2% (95% CI 75%至88%)(差異23.9%;95% CI 6.6% ~ 41.1%, P=0.002)。在降低強度治療的比較中,2.8%證明了優於其餘比較的18.5%(差異15.7%;95% CI 7.4% ~ 24%, P=0.019)。

表2

分析中包括了降低強度療法的非劣效性試驗的例子。在網上看到的附錄1獲取所有31個試驗的完整書目

與未檢測低強度治療的試驗相比,當新治療為低強度治療時,主要結果的151個絕對差異點估計更傾向於主動對照(60.3% vs 22.2%;差38.1%;P < 0.001)。這些結果如圖所示圖3(黑圈代表降低強度治療的比較,x代表所有其他比較)。檢查圖3顯示在小樣本量試驗中,支持主動對照的點估計不足,這一發現表明可能存在發表偏倚;然而,正式的出版偏倚測試(Begg和Mazumdar20.和哈伯德21),這是已知的不敏感,在統計上沒有顯著意義。對於151個結果可按比例計算的比較,試驗降低強度治療與未測試降低強度治療的試驗之間的平均絕對風險差異為+2.5% vs .−0.7%(差異3.2%;P=0.018),正值有利於主動控製。在這些試驗中,降低強度治療的試驗與所有其他試驗的平均預定非劣效性邊際幾乎相同(8.8% vs 8.4%;差0.4%,P = 0.73)。

圖3

試驗中分析的患者總數的對數與151個可計算比例的比較中主要結果的絕對風險差異繪製成線圖。降低強度療法(黑圈)的試驗往往具有絕對風險差異,有利於積極控製。圖中右下方的數據點少可能表明發表偏倚。RIT,降低強度治療。

作為敏感性分析,我們將其他試驗編碼為降低強度治療,以確定降低強度治療的不同定義是否會影響結果。有6個試驗中,主動對照是標準的護理,但沒有足夠的證據表明其優於安慰劑,並與安慰劑作為新療法進行了比較。一個例子是房顫患者圍手術期橋接抗凝與安慰劑的對比試驗。22當這些試驗被編碼為降低強度治療時,我們所有分析的結果在實質上沒有變化(數據未顯示)。

討論

在安慰劑對照優勢試驗中,研究人員通常使用試驗治療的最高耐受劑量,以最大限度地分離試驗人群,並增加發現統計顯著結果差異的可能性。23相反,在非劣效試驗中,主動對照劑量不足會使結果偏向零,並增加在試驗治療確實劣效時錯誤宣布非劣效的概率。5 24 25我們確定了一個獨特的非劣效性試驗子集,研究人員將降低強度的治療與相同的全強度治療進行比較。這種安排導致了對這些試驗的解釋上的錯誤,即使它創造了一個評價非自卑試驗的理論基礎的機會。我們的結果表明,在非劣效試驗中,當降低強度的治療與全強度主動對照相比時,結果在絕對值上不傾向於降低強度的治療,當與非劣效試驗相比時,沒有比較兩種不同強度下基本相同的治療。這一觀察結果並不完全與非劣效試驗的一般目標不一致,即排除大於預先規定的差值的差異。盡管如此,我們的研究結果強調,在解釋低強度治療的非劣效性試驗的結果和結論時需要謹慎。建議臨床醫生仔細檢查結果,重點是使用的三角切緣和結果的95% CI,以確定它包括臨床重要值。26日27日此外,有必要仔細評價減少劑量所聲稱和證明的好處,無論是減少成本、副作用還是不便,以確保任何功效損失都是由這些次要因素造成的。同樣,設計這些試驗的研究人員應該認識到生物蠕變的內在威脅,並在設計試驗時采用適當的保守的非劣效性邊際。值得注意的是,在我們的隊列中,降低強度療法的試驗並沒有使用比其他試驗更保守的非劣效邊際,可能是因為對其有效性的增強威脅迄今未被認識到。雖然我們的重點是降低強度療法試驗的特定脆弱性,但所有非劣效性試驗都容易失去對安慰劑和生物蠕變的假定優越性。

據我們所知,此前沒有研究在非自卑試驗中評估降低強度療法的效果,也沒有生物蠕變的實證證明,這仍然是一個理論概念。這是因為如果要證明生物蠕變或某些假設優於安慰劑(有時稱為假定的安慰劑效應),就需要將實驗療法與安慰劑進行比較,而這通常在倫理上是不可實現的,這正是選擇非劣效設計的原因。4 28我們認識到,降低強度療法的非劣效性試驗構成了一種自然實驗,可以提供暗示性的經驗證據,證明其失去了假定的優於安慰劑的優勢。一些研究使用模擬來評估非劣效性試驗中的生物蠕變傾向,這取決於不同的潛在假設。8 - 10其中兩項研究包括一項基於經驗數據的模型8有明顯的生物蠕變風險,8 9而其中一人得出結論,如果滿足某些假設,風險幾乎為零。10這些模擬的結果在很大程度上取決於基本假設,特別是為模擬模型選擇的真實治療效果的分布。我們的經驗數據補充和補充了這些結果。一般來說,在非劣效性試驗中,有對實驗治療效果降低的擔憂,但不期望。在降低強度治療的情況下,基於劑量反應的考慮,有降低效果的預期。降低強度治療不會降低效果的唯一情況是,在治療和治療效果之間不存在劑量-反應關係,或者確定主動控製有效性的優勢試驗使用的劑量高到s型劑量-反應曲線的斜率為零。因此,我們的研究結果可作為生物蠕變理論概念的初步“概念證明”。

兩位審稿人對我們的結果提出了另一種解釋。審稿人注意到,由於非劣性或優性標準在降低強度療法的試驗中隻有58%得到滿足,所提議的生物蠕變序列在圖1在第一次非自卑試驗中有42%的試驗被打斷。也就是說,非劣勢試驗有效地過濾了真正的非劣勢療法。(如果發表偏倚導致不利結果沒有被區別發表,則有利結果的真實比例可能低於58%。)我們同意,許多降低強度療法的非劣效性試驗未能證明優越性或非劣效性是令人欣慰的,但我們注意到,大多數試驗確實符合非劣效性標準。這是令人擔憂的,因為任何非劣性的聲明都對delta的選擇高度敏感——隻要delta足夠大,任何治療都可以被宣布為劣性。

本研究的優勢在於基於先驗假設,采用了顯式、可複製和透明的方法。局限性包括我們隻對有限出版時期的選定期刊進行抽樣。由於影響最大的期刊似乎發表了大量的非劣效性試驗,這一限製的影響應該是最小的。通過將我們的分析擴展到我們研究期間前後的試驗,以及更全麵的一係列期刊,可以尋求對我們報告的效果的確認和複製。盡管我們證明了低強度療法的效果傾向於全強度,但將這些試驗與那些沒有比較不同強度療法的試驗進行比較存在生態謬誤。我們的發現隻能說明假設的優於安慰劑和早期生物蠕變的侵蝕,但不能確認這些現象是有效的。這樣做需要將降低強度的療法直接與安慰劑進行比較,而這通常在倫理上是不可行的。28盡管如此,該結果為降低強度治療的非自卑試驗提供了警示,實際上是所有的非自卑試驗。

結論

降低強度治療的非劣效性試驗顯示效果降低,但大多數符合非劣效性標準。這一發現與失去一些假定的優於安慰劑和早期生物蠕變相一致。研究結果證明了在解釋低強度治療的非劣效性試驗時要謹慎,並強調了在所有此類試驗中預先指定的非劣效性限度對於避免非劣效性的虛假聲明的關鍵重要性。

參考文獻

  1. 1.
  2. 2.
  3. 3.
  4. 4.
  5. 5.
  6. 6.
  7. 7.
  8. 8.
  9. 9.
  10. 10.
  11. 11.
  12. 12.
  13. 13.
  14. 14.
  15. 15.
  16. 16.
  17. 17.
  18. 18.
  19. 19.
  20. 20.
  21. 21.
  22. 22.
  23. 23.
  24. 24.
  25. 25.
  26. 26.
  27. 27.
  28. 28.
  29. 29.
  30. 30.
  31. 31.
  32. 32.
  33. 33.
  34. 34.
  35. 35.
  36. 36.
  37. 37.

腳注

  • 貢獻者SKA和AMH設計了這項研究,並進行了數據抽象和分析,起草和審查手稿。MHS對研究的設計和分析提供了批判性的分析,並協助起草、審查和修改手稿。

  • 資金這項研究沒有從任何公共、商業或非營利部門的資助機構獲得具體的資助。

  • 相互競爭的利益沒有宣布。

  • 病人的同意不是必需的。

  • 來源和同行評審不是委托;外部同行評議。

  • 數據共享聲明本文使用的數據集可以通過聯係通訊作者獲得。