用於醫療保健專業人員

教育和辯論

如何閱讀一篇論文:論文總結其他論文(係統評價和薈萃分析)

BMJ1997年;315年doi:https://doi.org/10.1136/bmj.315.7109.672(1997年9月13日出版)引用這個:BMJ315:672 1997;
  1. 格林哈爾希特麗莎高級講師(p.greenhalgh在{}ucl.ac.uk)一個
  1. 一個單位以證據為基礎的實踐和政策,初級保健和人口學係,倫敦大學醫學院/皇家自由醫院醫學院,惠廷頓醫院,倫敦N19 5 nf

    介紹

    記住你曾經寫的文章作為一個學生嗎?你可以瀏覽書籍和期刊的索引,直到你遇到一段看起來相關的,和複製出來。如果你發現不符合你提出的理論,你離開吧。或多或少,這構成了新聞回顧概述的方法主要研究尚未發現或分析係統(標準化和客觀)。

    總結分

    係統回顧概述主要研究使用顯式的和可再生的方法

    元分析是一種數學的合成兩個或兩個以上的主要研究結果,以同樣的方式處理同樣的假設

    盡管薈萃分析可以提高結果的精度,重要的是要確保評審的方法是有效的和可靠的

    相比之下,係統回顧的概述主要研究包含顯式聲明的目標,材料和方法,根據明確的和可再生的方法(圖進行1)。

    給出了係統綜述的一些優勢盒子。進行係統回顧時,不僅要尋找相關的文章是全麵和客觀,但拒絕使用的標準的文章作為“有缺陷的”必須是明確的和獨立的這些試驗的結果。最持久的和有用的係統評價,特別是由Cochrane協作,定期更新合並新的證據。2

    箱1:係統評價的優點3

    • 顯式方法極限偏差識別和拒絕學習

    • 結論更加可靠和準確的方法

    • 大量的衛生保健提供者可以快速吸收的信息,研究人員和政策製定者

    • 延遲之間的研究發現和實施有效的診斷和治療策略可能會減少

    • 不同的研究結果相比,可以正式建立generalisability發現和一致性(缺乏異質性)的結果

    • 異質性的原因(在整個研究結果不一致)可以被識別和新假設生成特定的子組

    • 量化係統評價(薈萃分析)增加總的結果的精度

    返回文本

    許多(如果不是大多數的話,醫學評論文章還是寫在故事或新聞形式。保羅Knipschild教授描述了諾貝爾獎獲得者生物化學家李納斯鮑林使用選擇性引用醫學文獻來“證明”他的理論,維生素C可以幫助你感覺更好,還能延長壽命。34當Knipschild和他的同事在文學係統搜尋證據支持和反對這一假設他們發現,盡管一個或兩個試驗表明,維生素C可以預防感冒的發生,有更多的研究並沒有顯示任何有益的效果。

    專家,多年來一直沉浸在一個主題,知道答案“應該”是什麼,更不能夠產生一個客觀審查的文學主題非專家。56這將產生的後果很小如果專家的意見可能是依賴與獨立係統評價結果一致,但是他們不能。7

    評價係統評價

    問題1:你能找到一個重要的臨床問題審查解決哪一個?

    問題解決的需要非常精確定義,係統回顧自評論家必須二分(yes / no)決定是否每個可能相關的論文將被包含,或者或者,拒絕為“無關緊要。“因此,例如,臨床問題”在心房顫動患者抗凝血劑防止中風嗎?應該完善客觀:“warfarin-type抗凝治療的有效性和安全性評估在二級預防(也就是說,以前的中風或短暫性缺血性發作)後患者non-rheumatic房顫:與安慰劑比較。”8

    問題2:是一個徹底的搜索做適當的數據庫和其他潛在的重要來源探索嗎?

    即使是最好的Medline搜索會錯過重要的文件,其他來源的評論家必須的方法。9查找引用的引用通常產生有用的文章不確定初始搜索,10和一個探索“灰色文獻”(盒子)可能是特別重要的醫學主流以外的學科,如理療或替代醫學。11最後,特別是在一個統計合成(薈萃分析)是預期的結果,可能需要編寫和問作者的原始數據的主要研究在個別病人沒有包含在發表評論。

    框2:係統回顧檢查表的數據源

    • Medline數據庫

    • 科克倫控製臨床試驗登記

    • 其他醫療和輔助醫療數據庫

    • 外國語言文學

    • “灰色文獻”(論文、內部報告,非同行評審期刊,製藥行業文件)

    • 引用(引用和引用等)中列出的主要來源

    • 其他未公開來源已知該領域的專家(尋求個人溝通)

    • 從已發表的實驗中原始數據(由個人溝通尋求)

    返回文本

    問題3:方法學質量評估和相應的試驗加權?

    係統的評論家的任務之一是製定一係列標準,包括泛型(共同研究)和特定的(特定字段)方麵的質量,來評價每個試驗(見盒子)。然而,應該注意在發展中這樣的分數,因為沒有黃金標準的“真正的”試驗的方法學質量12和複合質量分數往往在實踐中既不有效也不可靠。1314各種Cochrane協作評審小組正在開發特定主題的方法分配質量分數的研究。15

    盒3:分配重量在係統回顧試驗

    每個試驗都應該被評估的:

    • 設計方法學質量程度和行為可能會阻止係統誤差(偏見)

    • Precision-a測量的隨機誤差的可能性(通常描述為置信區間的寬度大約結果)

    • 外部結果generalisable validity-the程度或適用於一個特定的目標人群

    返回文本

    問題4:敏感如何結果審查已經完成的路嗎?

    卡爾Counsell和他的同事們“證明”(在1994年聖誕節的BMJ)一個完全寄生關係的結果搖骰子,急性中風的結果。16他們報道了一係列人工骰子滾動實驗,紅色,白色,綠色骰子代表不同的治療急性中風。總的來說,“試驗”顯示無顯著受益於三種療法。然而,許多完全合理的事件的模擬過程中meta-analysis-such作為“消極”的排除一些試驗通過發表偏倚,一個亞組分析,排除數據紅色骰子療法(以後,在回顧結果,紅色骰子似乎是有害的),和其他,本質上是任意的,排除“方法學質量”主導的理由顯然是非常重要的一個好處的“骰子療法”在急性中風。

    如果這些模擬結果是否是一個真正的醫療爭議,你會如何發現這些微妙的偏見?你需要工作通過假設。如果係統綜述的作者改變了入選標準?如果他們已經排除了未發表的研究什麼?如果他們的“質量權重”被分配不同?如果試驗方法學質量較低的被包括(或排除)?如果所有的病人下落不明的審判被認為已經死亡或被治愈嗎?

    的勘探ifs稱為靈敏度分析。如果你發現擺弄數據以不同的方式很少或沒有區別評估的總體結果,您可以假定的審查結論是相對強勁的。但是,如果重要發現消失時的任何假設的變化,表達的結論應該更謹慎和之前你應該猶豫改變你的做法的。

    問題5:計算結果解釋由於常識和對更廣泛的方麵的問題嗎?

    任何數值結果,然而精確、準確、“重要的”或否則無可爭議的,必須放置在非常簡單的背景下的,而且經常令人沮喪地審查解決一般問題。臨床醫生必須決定如何(如果有的話)這個數值結果,不管是否重要,應該影響個體病人的護理。時需要考慮的一個特別重要的功能進行評價係統回顧是外部效度或相關性的試驗包括在內。

    non-statistician的薈萃分析

    良好的薈萃分析是non-statistician理解比通常更容易,因為它主要研究論文的堆棧。除了合成數值數據,meta-analyst的部分工作是在入選標準彙總相關信息,樣本大小、患者基線特征,提取率,結果所有研究的主要和次要終點包括在內。盡管這樣的表通常是視覺上令人生畏的,他們幫你不得不費力地通過每篇論文的方法部分和比較一個作者的列表結果與另一個作者的餅圖或柱狀圖。

    這些天,薈萃分析的結果往往是在一個相當標準的形式,如由計算機軟件MetaView。3是一個圖示(俗稱“森林陰謀”)的集中優勢比8個隨機對照試驗,每個比較冠狀動脈旁路移植和經皮冠狀動脈血管成形術治療嚴重的心絞痛。17主要(主要)在這個薈萃分析的結果是死亡或心髒病發作在一年內。

    ">圖2
    圖2

    集中優勢比8個隨機對照試驗的冠狀動脈旁路移植對經皮冠狀動脈血管成形術,MetaView所示格式。複製與作者的許可17

    八的水平線相應試驗顯示了相對風險心髒病死亡或在一年患者隨機冠狀血管成形術相比病人隨機搭橋手術。每一行的“blob”在中間的點估計是團體之間的差異(最好的單估計生活保存通過心髒搭橋手術的好處而非冠狀動脈血管成形術),和線的寬度代表的95%置信區間估計。圖片的黑線中間被稱為“沒有影響,”,在這種情況下與1.0的相對風險相關聯。

    如果結果的置信區間(水平線)穿過線沒有影響(垂線),這就意味著要麼之間沒有顯著差異的治療或樣本量太小,讓我們有信心真實結果的所在。各種單獨的研究給點估計的相對風險的冠狀血管成形術相比搭橋手術在0.5和5.0之間,以及一些研究的置信區間是如此之大,以至於他們甚至不適合在圖上。現在看看下麵的小鑽石水平線。這是彙集所有8個試驗的數據(冠狀血管成形術相比搭橋手術的總體相對風險= 1.08),用一個新的、更窄,置信區間的相對風險(0.79到1.50)。自從鑽石牢牢重疊沒有影響,我們可以說,兩者之間可能是沒有選擇治療的主要終點(第一年死亡或心髒病)。現在,在這個例子中,每一個人的八個試驗還建議非重大的影響,但他們中沒有一個是樣本容量足夠大讓我們確信,陰性結果。

    但是請注意,這個小小的鑽石並不意味著你不妨提供冠狀血管成形術而不是每個患者心絞痛心髒搭橋手術。它有一個更有限意味著普通患者的試驗提出了薈萃分析同樣可能會見了主要結果(一年內死亡或心肌梗塞),無論這兩個隨機接受治療。如果你讀的論文可以和同事17你會發現重要團體的患病率的差異進一步手術治療後心絞痛和要求的初始過程。

    解釋異質性

    薈萃分析的語言,同質性意味著每個試驗的結果是在數學上兼容其他的結果。同質性可以估計一眼一旦試驗結果提出了數據的格式說明3和4。在3每一個審判的置信下限低於所有其他的信心上限(即水平線所有重疊在某種程度上)。統計上來說,試驗是同構的。相反,在4有些線路不重疊。這些試驗可能是異構的。

    ">圖3
    圖3

    減少心髒病的風險策略來降低膽固醇。複製許可查爾莫斯和奧特曼18

    異質性的最終測試涉及到一個稍微複雜的統計策略比拿著統治者與森林的陰謀。最常用的是χ的一個變種2(x平方分布)測試,因為解決的問題是是否有試驗的結果之間的差異大於兼容的機會。湯普森18提供以下的經驗法則:一個χ2統計,平均價值等於它的自由度(在這種情況下,試驗的薈萃分析- 1)的數量,所以χ27.0一組八個試驗將提供無統計學異質性的證據。注意,顯示統計學異質性是一個數學鍛煉和統計員的工作,但這解釋異質性(尋找,占臨床異質性)是一個釋意鍛煉和需要想象力,常識,和實際的臨床或研究經驗。

    4顯示了十個試驗的結果的膽固醇降低的策略。結果表示為百分比減少患心髒病的風險與每個減少0.6 l更易與相關血清膽固醇濃度。的橫線代表每個結果的95%置信區間很明顯,甚至不知道χ2127年的統計數據,試驗高度異構。修正的數據受試者的年齡這個值減少到45。換句話說,“不兼容”的這些試驗的結果可以用這一事實來解釋著手策略成功地大幅降低你的膽固醇水平會更容易防止心髒病發作如果你45比如果你是85。

    臨床異質性,本質上,是教授漢斯艾森克的不滿,他構建了一個充滿活力和有趣的批判的科學分析。19在命喪黃泉的世界和分割,艾森克分配器,它冒犯了他的定性和特定的結合研究結果針對不同人群在不同的時間在不同的地方和不同的原因。

    本係列的文章中摘錄如何閱讀一篇論文:循證醫學的基礎知識嗎。這本書對搜索文獻包括章節和實現基於證據的發現。它可以從英國醫學雜誌出版集團:訂購電話0171 383 6185/6245;傳真0171 383 6662。非會員價格£13.95英國成員,£14.95。

    艾森克的保留意見薈萃分析證實在臭名昭著的名譽掃地的薈萃分析顯示(錯誤地),給靜脈鎂有心髒病的人是有益的。隨後megatrial涉及58 000例(ISIS-4)沒有找到任何好處,和meta-analysts誤導性結論隨後發表偏倚,解釋方法論的弱點在小試驗,和臨床異質性。20.21

    確認

    感謝教授伊恩•查爾莫斯本章建議。

    引用

    1. 1。
    2. 2。
    3. 3所示。
    4. 4所示。
    5. 5。
    6. 6。
    7. 7所示。
    8. 8。
    9. 9。
    10. 10。
    11. 11。
    12. 12。
    13. 13。
    14. 14。
    15. 15。
    16. 16。
    17. 17所示。
    18. 18歲。
    19. 19所示。
    20. 20.
    21. 21。
    Baidu
    map