條文本

下載PDF

治療效果的評價person-level異質性發表多人N-of-1研究:係統回顧和再分析
  1. Gowri拉曼1,
  2. 伊桑M猶豫2,
  3. 拉娜賴3,
  4. 詹妮弗·史4,
  5. 傑弗裏·陳5,
  6. 詹妮弗·魯茲年代3,
  7. 羅伯特W杜波依斯6,
  8. 理查德·L Kravitz7,
  9. 大衛·米肯特3
  1. 1臨床證據合成中心臨床研究所和衛生政策研究,塔夫茨醫學中心/塔夫茨大學醫學院的,波士頓,美國
  2. 2證據合成中心衛生、公共衛生學院,布朗大學,普羅維登斯,羅德島州美國
  3. 3預測分析和比較效率(速度)中心,臨床研究所和健康政策研究,塔夫茨醫學中心/塔夫茨大學醫學院的,波士頓,麻薩諸塞州美國
  4. 4中心的健康價值和風險評估,臨床研究所和衛生政策研究,塔夫茨醫學中心/塔夫茨大學醫學院的,波士頓,美國
  5. 5波士頓醫療保健係統,醫療組織和實施研究中心(合唱),波士頓,麻薩諸塞州美國
  6. 6國家藥品委員會,華盛頓,哥倫比亞特區美國
  7. 7內科,加州大學戴維斯分校,舊金山,加州美國
  1. 對應到David M肯特;dkent1在}{tuftsmedicalcenter.org

文摘

客觀的個別患者同等條件下可能會有不同的反應類似的治療。我們的目標是總結的報告person-level異質性的治療效果(不停地)多人N-of-1研究和審查的證據person-level通過再分析。

研究設計係統的檢查和再分析多人N-of-1研究。

數據源Medline,科克倫對照試驗、EMBASE、網絡科學審查引用N-of-1研究通過2017年8月發表在英語。

研究選擇N-of-1藥理幹預的研究至少有兩個主題。

數據合成引文中抽取,進行篩選和數據複製。我們進行統計再分析測試person-level不停地在所有研究呈現person-level數據。

結果我們確認62多人N-of-1研究至少有兩個主題。統計測試檢查包括被描述在隻有13(21%),其中隻有兩個(3%)測試person-level奉送。隻有25(40%)的研究提供足夠的可利用person-level HTE person-level數據。再分析使用固定效應線性模型確定統計學意義person-level奉送8(62%)的13個研究報告person-level治療效果和8(57%)的14個研究報告person-level結果。

結論我們的分析表明,person-level是普遍的,往往也是可觀的。綜述了研究不完備信息person-level治療效果及其變化。改進了person-level治療效果的評估和報告多人N-of-1研究是必要的。

  • perseonalized醫學
  • N-of-1研究
  • 係統綜述
  • 異質性的治療效果

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 我們的分析表明,person-level異質性的治療效果(不停地)是普遍的,往往也是可觀的。

  • 我們的分析缺乏有限的N-of-1研究的文獻和低統計力量可用的研究。

  • 多人N-of-1研究是最好的設計來估計個別病人治療效果和比較個體內變異個體之間的差異的影響在不同的時期。

介紹

臨床醫生通常觀察到個別病人給予相同的治療相同的條件似乎有不同的反應。這個觀察,結合我們對疾病和治療的複雜機製的理解和無數患者的潛在重要性因素(如年齡、性別、疾病嚴重程度、並發症,co-treatments影響藥物動力學和動力學和分子差異),導致了一個普遍的假設,個體間的觀察治療反應的變化不僅僅是隨機的,但穩定和潛在的可預測的。這種假設支撐個性化醫學領域,旨在確定最佳治療一個病人,而不是治療所有患者的幹預發現最有效的“平均”的病人。

然而,統計分析,旨在發現異質性的治療效果(不停地)組間的個體(例如,子群分析並行隨機試驗)通常找不到令人信服的和可靠的證據表明這種異質性的存在。例如,男女之間在統計上有顯著差異的治療效果往往報道,但係統回顧表明,這些交互的頻率在研究表明絕大多數偶然發生。1藥物基因學領域,同樣也建立在假設穩定的治療反應的變化,在很大程度上未能兌現承諾廣泛提高drugs-particularly針對特殊情況外的腫瘤(研究通常依賴於子分類的腫瘤組織而不是遺傳多態性的變化)。2 3這個失敗尋找可再生的支持反向概念,真正的個人的影響可能是一個“神話”,overinterpretation隨機噪聲。4

區分這兩種可能性,Kalow5表明,精心設計一係列N-of-1研究可以執行那些慢性病適合這個設計(即在疾病過程相對穩定的隨著時間的推移,治療效果是短暫的和結果不同,可見隨著時間的推移)。通過評估個別病人治療效果和比較的變化影響之間的個人差異個人在不同的時期,可以確定非均質性的隨機組件在個別治療作用甚至如果一個無法識別的變量預測這種變化(例如,即使沒有組級別奉送,男人和女人或老人和年輕人等)。

最近總結N-of-1研究報道literature-including多人N-of-1研究,但還沒有檢查是否和如何將這些研究提供person-level看那些信息。因此,我們的目標是(1)總結進行評估和報告的變化從N-of-1 person-level治療效果研究和(2)中提取,重新分析和報告的結果的研究提供足夠的數據子集發布報告檢查person-level的證據的程度(即participant-level結果或影響)。6

方法

本文是按照最高標準進行係統評價。7 8我們定義N-of-1研究作為交叉試驗,每一個在一個預定義的病人接受兩個或兩個以上的治療,通常隨機序列。

數據源和搜索

我們使用兩個單獨的搜索,因為N-of-1研究可以被索引不同:(1)搜索在Medline,科克倫中部和EMBASE使用術語相關的重複交叉研究(出版物索引從開始到2017年8月17日),(2)Medline,科克倫中部、EMBASE科學和網絡搜索相關的使用術語N-of-1(出版物索引從2011年到2017年8月17日)。N-of-1研究索引在2011年之前,我們使用係統綜述發表的研究包括在之前加布勒6我們的搜索術語和醫學主題詞N-of-1相結合,單一學科,同一病人,隨機試驗,交叉,multiperiod交叉和旋轉或重複交叉(見在線補充附錄表1和2詳細的搜索條件)。搜索沒有受到疾病、條件、器官係統或治療。

研究選擇

我們選擇合格的多人N-of-1研究描述單個結果的報告的頻率和效果和記錄在這些研究中。我們至少需要兩個人每個研究對象的評價。我們排除了研究,包括後備幹預、評論、抽象和協議。我們包括研究與安慰劑或不治療的幹預措施。引用被評論家雙重篩選使用一個開源,在線軟件Abstrackr (http://abstrackr.cebm.brown.edu/)。全文可能相關的研究再次雙資格篩查。

Person-level結果被定義為結果每個人在每個時間點測量時,在表、報告文本或圖形。Person-level治療效果被定義為對比結果的個人在一個治療和比較器。Person-level回去被定義為量化變化Person-level治療效果,而包括更廣泛的包括任何類型的亞組分析(例如,男性和女性;老和年輕)中概述圖1

圖1

概要描述person-level結果(結果為每個病人在每個治療周期);person-level效果(對比結果為每個病人的治療條件與另一個)和person-heterogeneity治療效果(病人之間對比的效果)。

數據提取和質量評估

從每個出版的四個評論者提取數據;第二個審稿人驗證所有的數字信息和研究設計的基本描述和分析。操作定義提取項目每周項目會議,討論之間的差異提取器解決了共識與高級作者(DK、GR、EB)。從每個研究中,我們提取的書目信息,相關細節研究設計(登記的患者數量,選擇標準,幹預措施評估、隨機方法、結果評估,後續持續時間),病人的信息特點和person-level測量結果或估計person-level治療效果(不確定性)的相應措施。在必要的時候,我們通過數字化圖和提取的數據值估計使用Engauge數字化儀V.2.14 (http://digitizer.sourceforge.net/)。我們評估每個研究的方法學質量根據預定義的標準,按照衛生保健研究和質量提出方法和Cochrane偏見對臨床試驗的風險。9日10

我們生成的圖表顯示響應軌跡的每個病人每個研究和比較他們發布的信息。我們還生成的散點圖測量隨著時間的研究,沒有圖形格式的數據來幫助我們識別異常數據點(例如,錯誤數據提取)。我們驗證潛在的異常數據點通過重新審視發表數據,修正,在需要的時候。

數據合成和分析

我們檢查的研究報道person-level數據。這是描述為每個報告結果使用下列事項:(1)定性的描述(例如,“有八反應者和四個無”);(2)person-level結果的詳細信息(例如,結果每次治療在每個時期);(3)person-level治療效果的詳細信息(例如,一個點估計的對比結果的個人在一個治療與比較器);(4)報告person-level統計效應估計(例如,SD,確切的p值或獨聯體治療效果在個人);(5)的描述統計測試檢查奉送(即測試評估治療效果的對比研究中個人或團體之間)和(6)的索賠。注意項目1的定性描述將包括任何暗示治療效果不同的描述,而六項要求一個更明確的研究結論(例如,“我們的結果表明重大變化在個人對治療的反應X '),這些結論是基於是否健壯的統計測試。

統計分析提取研究的結果

我們進行統計分析測試person-level不停地在所有研究呈現person-level數據。我們使用了一個一致的分析策略的研究,在一定程度上允許發表論文的報告。我們的策略是不同的研究報道person-level測量結果和那些報道估計person-level治療效果與抽樣方差(或足夠的信息大約計算這些統計數據)。

僅供研究報告(或允許的計算)估計person-level治療效果,我們獲得的平均效應使用固定效應的逆模型和方差估計的方差person-level治療效果使用DerSimonian和Laird時刻估計量的方法。11日12除了固定效應模型,我們也用一種隨機影響模型獲得的平均效應。最後,我們測試了所有的假設person-level使用科克倫的χ治療效果都是平等的2測試和量化觀測到的比例變化由於“真實”person-level異質性影響我2統計。13

的研究報道person-level結果,我們開發了一個線性模型(連續的結果)或廣義線性模型(用於二進製或計數結果)使用感興趣的結果作為回應,幹預(s)作為協變量和指標變量不同的研究參與者。14這個模型估計在參與者共同的治療效果。我們也得到類似的模型與treatment-by-participant交互。這個模型允許每個病人有不同的效果。person-level HTE統計學意義的評估比較兩個模型的似然比檢驗。除了固定效應模型,我們也適合分層線性或廣義線性混合模型與隨機攔截和一個隨機的斜率(治療效果)來評估所有患者平均處理效應(假定person-level HTE)。我們測試的假設所有person-level治療效果都是平等和量化觀測到的比例變化由於異質性與我“真正”person-level效果2統計。13造型within-patient方差,我們使用常見的方差和一個不相關的協方差結構,就像之前用於N-of-1研究。14Person-level治療效果被認為是平等的跨時期。治療的效果,我們使用一個以上的隨機斜率當比較兩個以上的治療。

病人和公眾參與

病人和公眾並沒有參與這項研究的設計和分析。

結果

搜索重複交叉研究確定了11 891引用這些N-of-1研究確定了3819引用(索引從2011年起)。其中,我們407全文檢索回顧+ 100 N-of-1試驗文章(索引之前,2011)從現有係統的審查。562年全文篩選研究(58多人N-of-1研究和四個重複周期交叉研究)合格標準(在線見麵補充附錄表3報告)和多人N-of-1研究在整篇文章中。的搜索和研究的大綱選擇流中提供圖2

圖2

研究流程圖代表資格的流動研究綜述。

描述的研究

表1總結了62多人N-of-1研究發表在1986年和2017年之間報道共有1974名患者。最常見的臨床領域多人N-of-1研究神經學(16%)、關節炎和風濕病(10%)和精神病學(9%)。大多數研究描述為“雙盲”,但細節致盲的方法通常不清楚;類似的研究通常提供不清楚隨機序列的生成和分配信息隱藏(在線補充附件表4)。在這些研究中,93%的治療策略相比,5%三種策略四個策略相比,增長了2%。研究3至16個治療周期,取得了平均1-42測量結果。在報告的結果,89%的病人評估結果報告,11%的被調查者評估。

表1

證據多人地圖N-of-1反複交叉研究

報告person-level結果,效果和奉送

雖然大多數研究(92%)有一些定性確認,治療效果似乎因個人而異,正式報告參與者級別的變量(表2)。Person-level結果在每個治療被報道在52%的多人N-of-1研究。Person-level治療效果與定量數據(比較結果在每個治療)為每個人完成了試驗中可用32%;和細節的統計學評價這些影響(SD或確切pvalues或置信區間)在13個(21%)有多人N-of-1研究。隻有5個(8%)研究描述統計測試檢查任何奉送。然而,隻有兩項研究(3%)報告person-level奉送,而其他人檢查組級別上的使用傳統的基於亞組分析可以觀察到的特征。

表2

評估的調查在多人N-of-1研究

person-level數據的再分析

62年的研究中,有36個研究person-level提供數據,在每個治療周期結果或者person-level治療效果(表3)。其中,隻有25項研究提供了有關:person-level數據足以支持14 person-level提供研究成果;13個研究提供person-level治療效果(兩項研究提供了)。剩下的11項研究報告中位數或意味著沒有數據方差或死亡者沒有提供足夠的信息,所以他們不能重新進行治療效果或奉送。

表3

研究報告person-level數據的特征

13研究(27獨特的比較),可以分析的報道person-level治療效果數據(表3),10個研究安慰劑比較器和三個研究有一個活躍的比較器。樣本大小範圍從7到68;平均交叉時間範圍從6到16天,平均每節課結果測量範圍從1到21歲。平均治療時間範圍從14到336天。

有14個研究(27獨特的比較),可以分析的報道person-level結果數據(表3),包括兩項研究也報道person-level治療效果。幹預與安慰劑相比,11和3個研究比較兩個積極的幹預措施。樣本大小範圍從2到22;交叉時期的平均數量範圍從3 - 10和結果的平均數措施/時間範圍從1 - 42。平均治療時間範圍從9到210天。

再分析的研究報告估計person-level治療效果

13個研究(包括27個比較,由於多個結果在一些研究)報告的估計person-level治療效果足以分析(在線補充附錄圖1 - 16顯示圖形的person-level治療效果數據)。平均固定效應估計為每一個分析所示表4;隨機估計通常是類似的(在線補充附錄表5)。8的13個研究(62%)和15的27總獨特的比較(56%),我們發現統計上顯著的證據包括至少一個結果(表4)。一般來說,個別病人的變化影響的大小(見範圍)與平均相比是非常大的影響。大多數研究(64%)顯示person-level影響不同定性。大部分的觀察到的個人影響的變化可歸因於“真正的”(隨機)異質性person-level效應;11我27分析2> 80%。

表4

分析結果的研究報告person-level治療效果

再分析的研究報告person-level測量結果

因為一些14個研究提供可被分解的結果數據的多個結果(或多個結果尺度),總共有27個比較可以分析的數據。(在線補充附錄數據17-42結果結果顯示圖表的人水平。)平均固定效應估計為每一個分析所示表5;隨機效應估計通常是類似的(在線補充附錄表6)。在八的14個研究(57%)(17 27個獨特的比較(63%),有顯著person-level包括至少一個結果。的個體效應的差異往往是大型的平均效應。然而,考慮到降低每個研究的參與者數量和時間每個參與者也不同的分析方法,我的估計22在這些研究更精確。

表5

研究報告person-level結果

討論

本文文檔多人N-of-1研究很少檢查奉送。隻有8%的62多人N-of-1研究描述統計測試檢查回去,但這通常涉及比較組患者的治療效果(例如,基於年齡或性別),而不是在個人。隻有兩個在整個文學研究檢測person-level奉送。15日16然而,可以分析的person-level結果有時報道在多人N-of-1研究結果或治療效果,適合分析person-level奉送。我們可利用的全部可用的數據從這些研究(n = 25)建議的存在大量的隨機變化在大多數研究在個體的治療效果。這是明顯的在考慮統計測試的變化定性評估的患者治療效果和影響的大小變化。這是第一個廣泛的實證檢驗和再分析person-level不停地在多人N-of-1研究,並且提供了一些一般性的支持個別病人的先驗假設變化廣泛激發個人化藥物的治療反應。

相比與這些相應平行的組織研究,在一組患者共同建立有效性條件,N-of-1研究建立幹預個人的影響。17在這方麵,N-of-1研究被認為是臨床護理兼職教授,在一個特定的目標是選擇正確的治療病人,而不是作為一個研究工具,我們的目標是創造新的generalisable知識。18 19事實上,傳統N-of-1研究的結果隻能generalisable未來患者的治療反應試驗,其他病人。然而,使用貝葉斯整合技術,Zucker展示了民眾的平均處理效應估計也可以通過結合多人N-of-1研究測試相似的幹預患者相同的結果的措施。14也提出了類似的貝葉斯方法分析組級別奉送。20.

在此,我們證明N-of-1研究的一個新的應用程序,探索person-level奉送。這個應用程序有重要的研究和臨床意義,即使回去的決定因素仍不明。特別感興趣的,有明顯的變化學位person-level發現奉送的條件和治療。由於個體間的變異程度設置上限金額,可能可以解釋的可觀測的特點,如臨床或基因變量,尋找子群的影響沒有person-level回去是徒勞無功。4 21日22

一個有趣的例子person-level不停地在不同的條件可能會有所不同來自Johannessen的研究(圖3)。15這些研究者N-of-1病人進行研究比較西咪替丁和安慰劑的患者有消化不良的症狀和報告person-level影響疾病類別的子組。在46審判死亡者,西咪替丁對大多數患者(57%)有很大的影響,就像在總體水平。然而,不僅有大量person-level回去,但person-level不停地在條件不同,在non-ulcer消化不良(我更明顯2= 75%)與消化性潰瘍疾病(我2= 35%)(圖3)——非常相似的整體效應的出現這兩種情況。

圖3

Person-level變異在不同疾病情況。此圖描繪了46個不同N-of-1試驗的結果的西咪替丁Johanessen報道12西咪替丁與安慰劑的效果測量在每個主題在12交叉期超過184天張成的空間。而西咪替丁也有類似的平均效應無論指數條件下,有更大的一致性效應的消化性潰瘍患者疾病和更多的變化在影響non-ulcer消化不良患者。

發現變化person-level反應多人N-of-1研究識別那些N-of-1條件可能是臨床相關研究。condition-treatment組合顯示person-level HTE低,單一學科研究極不可能的臨床信息,和平均試驗結果(即“一刀切”的影響)更傾向於適用於個人。23日24另一方麵,N-of-1研究可能是高度臨床信息與高度的condition-treatments person-level奉送。這些條件也會潛在的更高的收益率研究的預測因子(基因或其他)。

我們的研究結果也為臨床實踐和規定的設計產生影響。條件,高person-level奉送,即使試驗表明,一個治療是比別人更好的平均,各種藥物的選擇將是有用的優化結果所有病人,特別是對於那些研究等慢性病經驗試驗的替代藥物為個體可能找到最好的治療方法是可行的。例如,3月的研究25表明,雖然骨關節炎患者平均減少了與雙氯芬酸疼痛和僵硬,一些患者對paracetemol改善症狀。這person-level回去可能不檢測常規parallel-arm試驗中采用傳統的亞組分析。21

雖然還需要更多的研究結合N-of-1的研究來理解的程度person-level奉送,未來的研究需要運用更大的改善尖端科學方法論的嚴格評估個人的治療效果。26雖然最近發表的統一標準報告試驗擴展N-of-1試驗可能有助於改善報告,表格的所有信息(可能是電子可用)出現最直截了當的方式,促進這些研究的臨床解釋。27這樣的報告可以檢查軌跡隨著時間的推移,可能不被回歸模型揭示模式。完整的報告也將促進開發和評估方法單一主題的分析實驗,尤其是用於更好地理解的程度和重要性person-level奉送。

本文反映的局限性,在很大程度上,主要研究數據的局限性。很多條件不適合N-of-1設計(例如,因為治療效應累積或結果隻觀察一次)。進一步,即使條件和治療可能適合這個設計,許多重要的疾病分類缺乏N-of-1發表的研究。我們僅依賴於已發表的研究,分析群體可能是低估的真正流行這些studies-particularly N-of-1研究可能經常沒有未來出版的意圖進行。

此外,我們的結論對於無處不在的數據中我們重新分析應該解釋的幾個重要的局限性。首先,隻有數量有限的可用的研究報告數據足夠的分析,因此我們現在隻有一個部分的照片全部在臨床條件下個人間的變化影響的範圍。此外,研究中有數據,隻有相當少數的病人被觀察到少量的治療期和我們經常不得不依靠作者提供的數據摘要(如person-level治療效果及其抽樣方差);這些數據的局限性杜絕使用更複雜的模型,例如,模型,考慮時間效應或其他的影響結果。3

我們的審查表明,不停地在多人仍然幾乎完全未知的N-of-1研究,探索的獨一無二的能力變化的個體(person-level)治療效果。我們再分析數據從這些研究是第一個係統的嚐試獲得實證支持先驗論證患者個體治療效果不同,一個假設支撐所有努力個性化治療的選擇。在這個示例中,person-level似乎是常見的、足夠大的臨床意義;person-level似乎奉送的程度不同的條件和結果。因此,多人N-of-1研究是一個未得到充分利用的工具來識別person-level HTE可能是實質性的,努力找到分子或臨床預測因素的反應應該關注的異質性。在這樣的條件下,平行臂研究可能產生結果,為病人over-generalised決策水平。

確認

我們願意承認Issa Dahabreh博士,女士的助理教授衛生服務,政策和實踐,流行病學助理教授,布朗大學,統計的建議。

女士,我們要感謝黛威廉姆森研究助理,預測分析和比較效益中心,臨床研究所和健康政策研究,塔夫茨醫學中心,用於幫助更新文學。

引用

  1. 1。
  2. 2。
  3. 3所示。
  4. 4所示。
  5. 5。
  6. 6。
  7. 7所示。
  8. 8。
  9. 9。
  10. 10。
  11. 11。
  12. 12。
  13. 13。
  14. 14。
  15. 15。
  16. 16。
  17. 17所示。
  18. 18歲。
  19. 19所示。
  20. 20.
  21. 21。
  22. 22。
  23. 23。
  24. 24。
  25. 25。
  26. 26歲。
  27. 27。

腳注

  • 貢獻者GR和DMK做出實質性貢獻的構思或設計工作;采集,數據的分析和解釋工作;負責起草或修訂工作至關重要的知識內容和取得了一項協議,負責所有方麵的工作在確保相關問題的準確性或完整性的任何部分工作適當的調查和解決。所有作者最後批準出版的版本。

  • 資金這項工作得到了國家醫藥委員會。提供了額外的支持以病人為中心的結果研究所(PCORI)獎(預測分析資源中心(SA.Tufts.PARC.OCSO.2018.01.25)和美國國立衛生研究院(3 ul1tr001079-04s1)。

  • 免責聲明所有語句在這份報告中,包括其調查結果和結論,僅代表作者,不一定代表的意見以病人為中心的結果研究所(PCORI),其理事會或方法。

  • 相互競爭的利益沒有宣布。

  • 病人的同意不是必需的。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據共享聲明沒有額外的數據是可用的。