用於醫療保健專業人員

研究方法和報告

棱鏡聲明報告係統評價和薈萃分析的研究,評估醫療幹預措施:解釋和細化

BMJ2009年;339年doi:https://doi.org/10.1136/bmj.b2700(2009年7月21日發布)引用這個:BMJ2009;339:b2700
  1. 亞曆山德羅Liberati12,
  2. 道格拉斯·G奧特曼3,
  3. 泰茲拉夫詹妮弗4,
  4. 辛西婭Mulrow5,
  5. 彼得·C Gøtzsche6,
  6. 約翰P埃尼迪斯7,
  7. 邁克•克拉克89,
  8. P J審視中國10,
  9. 喬斯Kleijnen1112,
  10. 大衛·莫赫413
  1. 1意大利摩德納di e Reggio Emilia,意大利摩德納
  2. 2Centro Cochrane犬,史Ricerche Farmacologiche馬裏奧·內格裏,米蘭,意大利
  3. 3統計中心醫學、牛津大學、牛津
  4. 4渥太華方法中心,渥太華醫院研究所,加拿大安大略省渥太華
  5. 5美國內科醫學年鑒》上發表的費城,賓夕法尼亞州
  6. 6北歐科克倫中心,哥本哈根,丹麥
  7. 7衛生和流行病學、約阿尼納大學醫學院的約阿尼納,希臘
  8. 8英國Cochrane中心,牛津
  9. 9護理和助產學院、三一學院、都柏林,愛爾蘭共和國
  10. 10醫學、臨床流行病學和生物統計學,麥克馬斯特大學,加拿大安大略省漢密爾頓市
  11. 11Kleijnen係統評審
  12. 12學校公共衛生和基層醫療(CAPHRI),荷蘭馬斯特裏赫特大學馬斯特裏赫特,
  13. 13流行病學與社區醫學,醫學院,加拿大安大略省渥太華
  1. 通信:alesslib在{}mailbase.it
  • 接受2009年6月5日

文摘

係統評價和薈萃分析是必不可少的總結證據相關醫療幹預措施準確、可靠的療效和安全性。這些報告的清晰度和透明度,但是,不是最優的。可憐的報告係統評價減少了他們價值的臨床醫生、政策製定者和其他用戶。

自開發QUOROM(薈萃分析的報告質量)報表報告指南出版於1999年,已經有幾個概念,方法,和實際的進步有關的行為和報告係統評價和薈萃分析。同時,評論發表的係統評價發現,關鍵信息報道這些研究往往不佳。意識到這些問題,一個國際集團,其中包括經驗豐富的作者和方法學家開發了棱鏡(首選項報告係統評價和薈萃分析)作為一個進化的原始QUOROM指南係統評價和薈萃分析評價的衛生保健幹預措施。

棱鏡語句由一個27-item清單和一個四階段流程圖。清單包括項目視為必不可少的透明的報告係統回顧。我們在這個文檔的理解和闡述,解釋每個清單項目的意義和基本原理。對於每個項目,我們包括良好的報告和一個例子,在可能的情況下,引用相關的實證研究和方法論的文學。棱鏡的聲明,這個文檔,和相關的網站(www.prisma-statement.org/)應該有用的資源來改善報告係統評價和薈萃分析。

介紹

係統評價和薈萃分析是必不可少的工具,總結準確、可靠地證據。他們幫助臨床醫生保持更新;為政策製定者提供證據來判斷風險,福利,醫療行為的危害和幹預措施;聚集在一起,為病人和他們的照顧者總結相關研究;為臨床實踐指南的開發人員提供一個起點;提供總結之前的研究的資助者希望支持新的研究;1並幫助編輯法官發布最新研究報告的優點。2最近的數據表明,至少有2500新的係統評價報告在英語在Medline每年索引。3

不幸的是,有相當多的證據表明,關鍵信息往往缺乏係統評價報告,從而減少其潛在效用。3456適用於所有研究,係統評價應充分報道,透明地讓讀者評估調查的優點和缺點。7原因導致的發展QUOROM(薈萃分析的報告質量)聲明;這些詳細的報告建議於1999年出版。8在本文中,我們描述了更新的指導。我們的目標是確保清晰的計劃,在係統回顧,發現。

術語用於描述係統評價和薈萃分析隨著時間的推移演變和變化在不同組的研究人員和作者(見框1結束的文檔)。在本文中,我們采用的定義由Cochrane協作使用。9係統回顧嚐試所有的經驗證據收集符合預先確定合格標準回答一個特定的研究問題。它使用顯式的、係統的方法選擇的偏差降到最低,從而提供可靠的研究結果可以得出的結論和決定。薈萃分析是使用統計方法來總結,結合獨立研究的結果。許多係統評價包含薈萃分析,但不是全部。

QUOROM語句及其進化成棱鏡

QUOROM聲明,1996年和1999年出版的,8是作為一個報告指導作者報告隨機試驗的薈萃分析。beplay体育官网官方登录自那以來,發生了很多。首先,知識進行係統評價和報告已經大大擴大。例如,Cochrane圖書館的方法注冊(包括報告的研究相關的係統評價方法)現在包含超過11 000項(2009年3月)。第二,有許多概念上的進步,如“產出水準”風險評估的偏差,1011適用於係統的評論。第三,作者已經越來越多的應用係統評價總結證據其它比隨機試驗。

然而,盡管進步,實施和報告的審查的質量遠遠沒有理想。3456所有這些問題促使需要更新和擴大QUOROM聲明。值得注意的是,認識到更新語句現在地址上麵的概念和方法論的問題,也可能比原來的更廣泛的適用性QUOROM聲明,我們改變了報告的名稱指導棱鏡(首選項報告係統評價和薈萃分析)。

棱鏡的發展

棱鏡的聲明是由一群29日評論作者方法學家、臨床醫生、醫學編輯,和消費者。12他們參加了一個三天的會議,2005年參與廣泛的會後電子信件。達成共識的過程,被告知的證據,隻要有可能,被用來開發一個27-item清單(表1所示)和一個四階段流程圖(圖1所示)(也可以作為研究人員的額外的物品在bmj.com上下載和重用)。物品被視為必不可少的透明的係統回顧報告是包含在清單中。流程圖最初提出的QUOROM也修改為顯示數量的確認記錄,排除文章,包括研究。11修訂集團批準後檢查表,流程圖,這說明紙。

表1

檢查表的項目包括在報告係統回顧和薈萃分析

把這個表:

棱鏡語句本身提供了更多細節關於其背景和發展。12這個附帶的解釋和細化文檔解釋了每個清單項目的意義和基本原理。幾棱鏡組參與者自願幫忙起草具體項目文檔,和四個(DGA,艾爾,DM和JT)見了幾次,進一步完善文檔,這是流傳並最終批準的大棱鏡組。

棱鏡的範圍

棱鏡關注作者可以確保透明和完整的係統回顧和薈萃分析報告。它不處理直接或詳細的方式進行係統評價,為其他指南。13141516

我們開發了棱鏡語句和這個說明文檔,幫助作者報道一係列廣泛的係統評價,評估醫療幹預的好處和壞處。我們認為大部分的清單項目相關報告係統評價non-randomised研究評估幹預措施的好處和壞處。然而,我們認識到,作者解決問題涉及病因學、診斷、預後,例如,流行病學或診斷準確性研究可能需要修改或將額外項目的係統評價。

如何使用這篇文章嗎

我們模仿這個文檔的理解和闡述後準備其他報告指南。171819本文檔的利益最大化,我們鼓勵人們閱讀它與棱鏡的聲明。11

我們現在每個清單項目和跟隨它發表範例項目的好報告。(我們編輯通過刪除引用一些例子或網址,或通過拚寫縮寫。)然後我們解釋相關的問題,包括項目的基本原理,從文獻和相關證據,隻要有可能。沒有係統的搜索進行了識別原型和證據。我們還包括七個盒子的文檔,提供一個更全麵的解釋某些主題方麵的係統評價的方法和行為。

雖然我們專注於最小的項目列表時要考慮報告係統回顧,我們顯示額外信息的地方需要提高透明度的審查過程。我們目前的項目數字從1到27個;然而,作者不需要解決項目在這個特定的順序在他們的報告。相反,重要的是每個項目的信息給出報告內的某個地方。

棱鏡清單

標題和摘要

項目1:標題

確定報告作為一個係統的回顧,薈萃分析,或兩者兼而有之。

例子“胸腔鏡與開放手術的複發率pneumothoraces複發的預防:係統回顧的隨機和non-randomised試驗”20.

“死亡率隨機化試驗的抗氧化補充劑初級和二級預防:係統回顧和薈萃分析”21

解釋作者應該確定他們的係統回顧和薈萃分析報告。“審查”或“概述”等術語不為讀者描述審查是否係統還是一個薈萃分析。最近的一項調查發現,50%的300年作者沒有提到“係統綜述”或“薈萃分析”條款的標題或抽象係統的審查。3雖然敏感搜索策略開發識別係統評價,22包含術語係統審核或薈萃分析的標題可以提高索引和識別。

我們建議作者使用的標題,使關鍵信息容易被讀者理解。理想情況下,一個標題反映了海岸邊的方法(參與者,幹預措施,比較器,結果,和研究設計)(見項目11箱2)可以幫助讀者,因為它提供了關鍵的信息審查的範圍。指定的設計(s)研究包括在內,如例子所示,也可以幫助一些讀者和搜索數據庫。

一些期刊推薦“指示性標題”表明這個話題的評論,而其他人則需要聲明標題給評審的主要結論。繁忙的從業者可能更願意看到標題中評審的結論,但聲明的標題可以過度簡化或誇大的發現。因此,許多期刊和方法學家喜歡顯示標題,在上麵的示例中使用。

項目2:結構化的總結

提供一個結構化的總結包括如適用,背景;目標;數據來源;合格標準研究,參與者,幹預措施;研究評價和合成方法;結果;限製;結論和影響的主要結論;資金係統綜述;和係統綜述登記號碼。

例子上下文:角色和劑量的口服維生素D補充nonvertebral骨折預防尚未完善。

客觀的:估計的有效性補充維生素D在預防老年人髖關節和nonvertebral骨折。

數據源:係統回顧英語和非英語的文章利用MEDLINE和Cochrane對照試驗注冊(1960 - 2005),和EMBASE (1991 - 2005)。額外的研究發現通過聯係臨床專家和參考書目和抽象在美國社會尋找骨和礦物質研究(1995 - 2004)。搜索條件包括隨機對照試驗(RCT),對照臨床試驗,隨機分配,雙盲法、維生素d3、維生素d2,人體內25 -羥維生素D,骨折,人類,老年人,瀑布,骨質密度。

研究選擇:隻有口服維生素D補充劑的雙盲相關(維生素d3、維生素d2)有或沒有補充鈣和鈣補充或安慰劑在老年人(> 60歲),檢查或nonvertebral髖骨骨折包括在內。

數據提取2:獨立提取文章的作者使用預定義的數據字段,包括研究質量指標。

數據合成:彙總分析都是基於隨機模型。5相關的髖部骨折(n = 9294)和7 nonvertebral骨折風險的相關(n = 9820)滿足我們的入選標準。所有試驗使用維生素d3。之間的異質性研究髖關節和nonvertebral骨折預防觀察,與低劑量後消失池相關的維生素d(400國際單位/ d)和高劑量(700 - 800 IU / d),分別。700到800國際單位的維生素D劑量/ D的相對危險度(RR)降低髖部骨折26%(3相關的有5572人;彙集RR 0.74;95%可信區間(CI), 0.61 - -0.88)和任何nonvertebral骨折23%(5相關的有6098人;彙集RR 0.77;95%可信區間,0.68 - -0.87)和鈣或安慰劑。沒有明顯的好處是觀察相關400 IU維生素d / d(2相關的有3722人; pooled RR for hip fracture, 1.15; 95% CI, 0.88-1.50; and pooled RR for any nonvertebral fracture, 1.03; 95% CI, 0.86-1.24).

結論:口服維生素D補充700到800國際單位/ D似乎減少臀部和任何nonvertebral骨折的風險動態或製度化的老年人。口服劑量的400 IU維生素D / D骨折預防是不夠的。”23

解釋摘要提供關鍵信息,使讀者能夠理解的範圍,過程和結果的審查和決定是否閱讀報告全文。抽象的可能都是現成的讀者,例如,在書目數據庫。抽象應該提供一個平衡的和現實的評估審查發現的鏡子,雖然時間很短,報告的主要內容。

我們同意別人的質量報告摘要發表在會議和期刊出版物需要改進。2425雖然我們不一致支持一個特定的格式,我們一般推薦結構化的抽象。結構化的抽象為讀者提供一係列標題有關目的、行為,發現和結論的係統性回顧報告。2627他們給讀者更完整的信息和方便查找信息更容易比非結構化的抽象。2829日30.31日32

一個高度結構化的抽象的係統回顧可能包括以下標題:上下文(或背景);客觀的(或目的);數據源;研究選擇(或合格標準);研究評估合成方法(或數據提取數據合成);結果;限製;和結論(或影響)。或者,一個更簡單的結構可以覆蓋但崩潰的一些上麵的標題(如標簽研究選擇研究評估作為複習的方法)或省略一些標題等背景限製

在上麵提到的高度結構化的抽象,作者使用背景為讀者和標題設置上下文解釋評審問題的重要性。下目標的標題,他們理想的使用元素的海岸邊(見框2)狀態的主要目標。在一個數據源搜索標題,他們總結來源,任何語言或出版物類型限製,搜索的開始和結束日期。研究選擇語句然後使用什麼理想的描述所選研究入選標準。數據提取方法語句描述評價方法在數據抽象和用於集成的方法或總結數據。的數據合成部分是主要審查報告的結果。如果評審包括薈萃分析,作者應該提供數值結果與置信區間的最重要的結果。理想情況下,他們應該在這些分析指定數量的證據(數字與數字的參與者)的研究。在一個限製標題,作者可能描述最重要的弱點包括研究以及評審過程的局限性。然後作者應該提供清晰和平衡結論密切相關的目標和結果的審查。此外,它會有幫助,如果作者包括一些資金審核信息。最後,盡管協議注冊係統評價仍然是不常見的做法,如果作者有注冊審查或收到一個注冊號,我們建議提供注冊信息的抽象。

考慮到上述因素,目標之間的內在張力的完整性及其保持抽象為期刊編輯設定的空間限製通常是被認為是一個重大的挑戰。

介紹

項目3:基本原理

的上下文中描述的基本原理回顧已知。

例子“扭轉的趨勢增加體重對身高兒童被證明是困難的。人們普遍認為增加能量消耗和減少能量攝入形式管理的理論基礎。因此,幹預旨在增加體育鍛煉和改善飲食的基礎努力預防和治療兒童肥胖。這種生活方式幹預已經被最近的係統評價,支持以及加拿大兒科協會、皇家兒科和兒童健康學院,美國兒科學會。然而,這些幹預措施充滿了可憐的依從性。因此,以學校為基礎的幹預措施理論上是有吸引力的,因為與幹預可以提高依從性。因此,許多地方政府已經製定或正在考慮強製增加身體活動在學校的政策,盡管這類幹預措施對身體成分的影響尚未評估。”33

解釋讀者需要了解背後的基本原理研究,係統回顧可能添加到已知的內容。作者應該告訴讀者是否他們的報告是一個新的係統評審或更新現有的一個。如果評審是一個更新,作者應該狀態更新的原因,包括已添加到以前版本以來的證據基礎的複習。

一個理想的背景或介紹,為讀者可能包括以下設置上下文。首先,作者可能定義審查的重要性問題從不同的角度(如公共衛生、個別病人或健康政策)。其次,作者可能簡要提及知識的當前狀態和其局限性。在上麵的例子中,幾種不同幹預措施的影響的信息可以幫助讀者理解潛在的相對利益或損害特定幹預措施需要審查。第三,作者可能會激起讀者的胃口通過清晰地闡明回顧旨在增加。他們也可能討論的程度的局限性可能克服現有的證據基礎。

第四項:目標

提供一個明確的聲明的問題被解決,參照參與者,幹預措施,比較,結果,研究設計(海岸邊)。

例子”來檢查是否局部管腔內的抗生素減少導管相關血流感染,我們回顧了隨機,對照試驗,評估這些抗生素的療效為初級預防導管相關血流感染和死亡率相比之下,沒有抗生素對成年人接受血液透析治療。”34

解釋問題被解決的基本原理,是一個係統回顧的最關鍵部分。他們應該陳述準確和明確,以便讀者能理解快速審查的範圍和潛在的適用性評估他們的利益。35框架的問題,包括以下五個“海岸邊”組件可以提高複習的明確性問題:(1)的患者人群或疾病(P),(2)感興趣的幹預或接觸(我),(3)比較器(C),(4)感興趣的主要結果或端點(O)和(5)研究設計選擇。更多細節關於海岸邊,見盒2。

好可以勉強集中或廣泛的審查問題,根據總體目標的審查。有時問題可能會增加結果的適用性和促進檢測偏差,探索性分析和敏感性分析。3536是否在很小範圍廣泛,恰恰說明評估的目標是至關重要的,因為他們幫助定義審查過程的其他組件,如合格標準(6)項和搜索相關文獻(7和8)項目。

方法

項目5:協議和登記

表明如果一個審查協議存在,如果它可以訪問(例如web地址),提供注冊信息,如果可用,包括登記號碼。

例子”方法的分析和入選標準預先指定並記錄在一個協議。”37

解釋一個協議很重要,因為它pre-specifies係統評價的目標和方法。例如,協議指定感興趣的結果,評論家將如何提取信息這些結果,評論者可能使用的方法定量總結結果數據(見項目13)。有一個協議可以幫助限製偏差的可能性事後決策評估方法,如選擇性報告結果。提供關於元素指導幾個來源包括協議的係統回顧。163839個別患者的立場的薈萃分析數據,我們建議作者描述設計協議是否明確,是否,何時,如何參與合作支持。4041

在研究作者可能修改協議,讀者不應該自動考慮這樣修改不合適的。例如,合法的修改可能擴展搜索到包含舊或新的研究,拓寬合格標準,證明太窄,或添加分析如果主分析表明,額外的保證。然而,作者應該描述的修改和解釋他們的理由。

雖然值得協議修正案很常見,一個必須考慮的影響協議的修改可能在係統回顧的結果,特別是主要的結果是改變了。選擇性報告結果的偏差隨機試驗已經被很好地記錄下來了。4243考試的47 Cochrane綜述揭示間接證據可能選擇性偏差對係統評價報告。幾乎所有(n = 43)包含一個主要的變化,如增加或刪除的結果之間的協議和完整的出版物。44(或程度)是否反映出改變偏見,但是,還不清楚。例如,它已經相當常見的不是描述結果,沒有提出任何包括研究。

注冊一個係統回顧,通常與一個協議和注冊號碼,還不常見,但有些機會存在。4546注冊可能降低多個評論的風險解決同樣的問題,45464748減少發表偏倚,更新係統評價時提供更大的透明度。值得注意的是,Medline收錄的係統評價的一項調查發現,2004年11月的報告協議使用增加了約46%3從8%提到在以前的調查。49的改善主要是由於Cochrane綜述,通過要求,出版協議。3

項目6:合格標準

指定研究特征(如海岸邊,後續的長度)和報告特點(如年認為,語言、發布狀態)作為標準資格,給予理由。

例子類型的研究:“隨機臨床試驗研究乙肝疫苗的政府CRF(慢性腎功能衰竭)患者,有或沒有透析。沒有語言,出版日期,或發布狀態的限令…”

參與者的類型:“任何年齡的參與者與CRF或接受透析(血液透析或腹膜透析)被認為是。CRF被定義為血清肌酐大於200µmol / L一段超過六個月或個人接受透析(血液透析或腹膜透析)…腎移植患者被排除綜述隨著這些個體的免疫抑製和正在接受免疫抑製劑藥物防止器官移植排斥的,他們基本正常腎功能……”

類型的幹預:“試驗比較有益和有害的影響乙肝疫苗佐劑或細胞因子co-interventions[和]試驗比較免疫球蛋白預防的有益和有害的影響。本文僅限於研究活躍的免疫接種。(等離子體或重組乙型肝炎疫苗(酵母)派生)的類型、劑量,治療和安慰劑,控製疫苗,或沒有疫苗…”

”類型的結果測量:主要結果措施:血清轉化,即足夠的患者比例anti-HBs響應(> 10 IU / L或樣本比例單位)。乙肝感染(以乙型肝炎核心抗原(HBcAg)積極性或持久HBsAg陽性),急性和慢性。急性(初級)乙肝病毒(乙型肝炎病毒)感染被定義為IgM anti-HBc血清轉化HBsAg陽性或發展。慢性乙肝病毒感染被定義為持久性的HBsAg超過六個月或HBsAg積極性和肝髒活檢兼容或慢性B型肝炎輔助診斷結果措施:不良事件的乙肝疫苗…[和]…死亡率。”50

解釋合格標準是至關重要的知識評價的有效性,適用性,全麵性的回顧。因此,作者應該明確地指定合格標準用於審查。仔細定義的合格標準通知各個步驟的評估方法。他們影響搜索的發展戰略選擇和服務,以確保研究的係統性和公正的方式。

可能描述的多個研究報告,和一個可以描述多個研究報告。因此,我們獨立的合格標準為以下兩個部分:研究特點和報告的特點。都需要報告。研究合格標準可能包括人群,幹預措施,比較器,結果,和研究感興趣的設計(海岸邊,看到盒2),以及其他一些具體的元素,比如指定後續的最小長度。作者應該國家研究是否會被排除在外,因為他們不包括(或報告)特定的結果,幫助讀者確定係統回顧可能偏見由於選擇性報告。4243

報告合格標準可能包括語言出版,出版地位(如包含未發表的材料和抽象),和出版年份。包含非英語語言文學,5152535455未發表的數據,以上數據可以影響效應估計的薈萃分析。56575859可能需要注意包括所有確定的研究由於潛在的偏見等不同的風險,例如,選擇性報告摘要。6061年62年

項目7:信息來源

描述所有信息來源在搜索(如數據庫的日期範圍,接觸研究的作者識別額外的研究)和日期最後一次搜索。

例子“研究發現通過搜索數據庫,電子掃描參考文章列表和與該領域的專家和製藥公司磋商…沒有限製申請語言和外國論文翻譯。這個搜索應用於Medline(1966年至今),CancerLit(1975年至今),和用於Embase(1980年至今),科學引文索引擴展(1981 -現在)和Pre-Medline電子數據庫。科克倫和敢(數據庫抽象的評論的有效性)綜述了數據庫…最後搜索是運行在2001年6月19日。此外,我們handsearched內容頁的臨床腫瘤學雜誌》2001年,歐洲癌症雜誌》2001年和2001年骨,加上抽象印花在這些期刊1999 - 2001。有限的更新進行文獻檢索從2001年6月19日到2003年12月31日。”63年

解釋國家醫學圖書館的Medline數據庫是一個世界上最全麵的醫療信息的來源。但是,就像任何數據庫,覆蓋不完整,根據領域不同。從任何單一數據庫檢索,即使是一位經驗豐富的搜索器,可能是不完美的,這就是為什麼在係統回顧詳細的報告是非常重要的。

至少,對於每一個數據庫搜索,作者應該報告數據庫,平台,或提供者(如奧維德,對話框,PubMed)和搜索的開始和結束日期的每個數據庫。這個信息讓讀者評估審查的貨幣,這是很重要的,因為出版時間間隔使廢棄一些評審的結果。64年這些信息也應該提高更新效率。65年作者還應該報告開發並進行搜索。66年

除了搜索數據庫,作者應該報告的使用輔助識別方法的研究,如手搜索期刊,檢查引用列表,搜索試驗注冊或監管機構的網站,67年聯係製造商,或聯係作者。作者也應報告如果他們試圖獲得任何缺失的信息(比如研究方法或結果)的調查人員或讚助商;是有用的簡述聯係誰,未發表的信息。

第八項:搜索

現在至少有一個主要的完整電子搜索策略數據庫,包括任何限製使用,這樣它可以被重複。

例子在文本:“我們使用以下搜索條件搜索所有試驗記錄和數據庫:免疫球蛋白*;丙種球蛋白;膿毒症;膿毒性休克;敗血症的;和敗血症…”68年

附錄:“搜索策略:MEDLINE(奧維德)

  • 01。免疫球蛋白/

  • 02。免疫球蛋白.tw美元。

  • 03。ivig.tw。

  • 04。1或2或3

  • 05。膿毒症/

  • 06。sepsis.tw。

  • 07年。膿毒性休克/

  • 08年。敗血性shock.tw。

  • 09年。敗血症/

  • 10。septicaemia.tw。

  • 11。septicemia.tw。

  • 12。5或6或7或8或9或10或11

  • 13。4和12

  • 14。隨機對照試驗/

  • 15。randomised-controlled-trial.pt。

  • 16。controlled-clinical-trial.pt。

  • 17所示。隨機分配/

  • 18歲。雙盲方法/

  • 19所示。單盲方法/

  • 20.14或15或16或17或18或19

  • 21。臨床試驗經驗/

  • 22。clinical-trial.pt。

  • 23。(中國的審判)美元.ti, ab。

  • 24。((singl或房子或trebl美元或美元tripl $)的(盲人)美元).ti, ab。

  • 25。安慰劑/

  • 26歲。安慰劑.ti美元,ab。

  • 27。隨機.ti美元,ab。

  • 28。21或22或23或24或25或26或27

  • 29。研究設計/

  • 30.比較研究/

  • 31日。實驗評價研究/

  • 32。後續研究/

  • 33。前瞻性研究/

  • 34。(控製或潛在或誌願者)美元美元.ti, ab。

  • 35。30或31、32或33或34

  • 36。20 - 28或29或35

  • 37歲。13 - 36”68年

解釋搜索策略是報告的一個重要組成部分的任何係統性回顧。搜索可能是複雜和迭代,特別是當評論家搜索不熟悉數據庫或他們的評論是解決廣泛的或新的話題。瀏覽搜索策略有興趣的讀者可以評估搜索的全麵性和完整性,並複製它。因此,我們建議作者報告他們的完整電子搜索策略,至少有一個主要的數據庫。替代呈現所有數據庫的搜索策略,作者可能表明如何搜索考慮其他數據庫搜索、索引詞不同的數據庫。如果不同搜索用於不同部分的一個更廣泛的問題(如相關問題的好處和危害的相關問題),我們建議作者至少提供一個策略的一個例子為每個目標的一部分。69年我們也鼓勵作者狀態搜索策略是否同行評議係統評價過程的一部分。70年

我們意識到,雜誌也不盡相同,在報告的文本搜索策略並不總是可行的。然而,我們強烈鼓勵所有期刊找到途徑作為web額外的附錄,或電子鏈接到一個存檔讓讀者訪問搜索策略。我們也建議所有作者存檔他們的搜索,這樣(1)其他人可以訪問和檢查(如複製或理解為什麼他們評論類似的話題沒有確定相同的報告),和(2)未來的更新他們的評論了。

幾個來源提供指導開發搜索策略。71年72年73年大多數搜索限製,如涉及時間或財務資源有限,無法訪問或不足索引報告和數據庫,不可用的專家與特定語言或數據庫搜索技能,或審查問題相關的證據並不容易找到。作者應該直接在描述他們的搜索約束。除了關鍵字用來確定或排除記錄,他們應該報告相關搜索任何額外的限製,比如語言和日期限製(參見資格標準,項目6)。51

項目9:研究選擇

狀態選擇研究過程(即篩選,確定資格,包含在係統回顧,和,如果適用,包含在薈萃分析)。

例子“資格評估…[是]執行獨立選取標準化地2評論家…評論者之間的分歧是通過共識來解決。”74年

解釋沒有標準選擇研究過程包括在係統回顧。作者通常開始大量的識別記錄的順序搜索和排除記錄根據合格標準。我們建議作者報告如何篩選檢索記錄(通常是一個標題和摘要),經常有必要回顧全文發表,如果任何類型的記錄(如信件編輯)被排除在外。我們還建議使用棱鏡流程圖概括研究選擇流程(見17和盒3項)。

努力增強客觀性,避免錯誤研究選擇是重要的。因此作者應該報告是否每個階段是由一個或幾個人,這些人是誰,當多個獨立調查人員進行選擇,什麼過程來解決分歧。使用至少兩個調查員可能減少拒絕的可能性有關報道。75年好處可能是最大的主題,選擇或拒絕一篇文章需要艱難的判斷。76年這些主題,作者應該告訴讀者的兩分的協議,一般仲裁如何選擇是必需的,和什麼是努力解決分歧(如接觸原始研究的作者)。

項10:數據收集過程

從報告描述數據提取的方法(如駕駛形式,由兩個獨立評論員)和任何過程從調查人員獲取和確認數據。

例子“我們開發了一個數據提取表(基於Cochrane消費者和通信審查小組的數據提取模板),測試包括10個隨機選擇的研究,並因此精製。一個評論的作者提取以下數據包括研究和第二作者檢查提取的數據…有分歧的解決兩個評論作者之間的討論;如果可以達成任何協議,這是第三個作者將決定計劃。我們聯係了五個作者對進一步的信息。所有反應和提供一個數值數據,隻有發表論文中以圖形的方式了。”77年

解釋評論家從每個提取信息包括研究,這樣他們可以批判,現在,在係統回顧和總結的證據。他們也可能接觸的作者包括研究沒有的信息,或者約定,報道。在個別病人數據的薈萃分析,這一階段包括詳細的原始數據庫的收集和審查。作者應該描述這些方法,包括任何措施來減少偏見和錯誤在數據收集和數據提取。78年(見附表3)

一些係統的評論者使用數據提取表單,可以報道作為附錄或“Web額外”報告。這些表格可以顯示讀者評論家尋求什麼信息(見11項)以及他們如何提取它。作者告訴讀者如果表單是駕駛。無論如何,我們建議作者告訴讀者提取數據,是否拔牙是在複製完成,,如果是這樣,是否重複抽象獨立完成和分歧是如何解決的。

發表的報告包括研究可能無法提供評審所需的所有信息。評論者應該描述任何行動他們尋求額外的信息從原始研究人員(見項目7)。描述可能包括他們如何試圖聯係人員,他們要求,他們成功地獲得必要的信息。作者還應該告訴讀者當個體患者數據尋求從原來的人員。41(見項目11)和顯示這些數據的研究中使用的分析。評論家理想也應該狀態是否確認信息的準確性包括在他們的審查與原來的研究人員,例如,通過送一份草案的審查。79年

一些研究已不止一次。複製出版物可能很難確定,他們的包容可能引入的偏見。80年81年我們建議他們使用作者描述任何步驟避免重複計算和拚湊數據從多個報告相同的研究(如對比了作者的名字,治療比較,樣本大小,或結果)。我們也建議作者表明是否所有報告的一項研究認為,矛盾可能揭示重要的局限性。例如,多個出版物的審查報告的藥物試驗表明,研究特征可能不同於報告報告,包括設計的描述,分析的患者數量,選擇顯著性水平,和結果。82年作者理想情況下應該提供任何算法,用於選擇重疊的數據報告和任何努力來解決跨報表的邏輯矛盾。

11項:數據項

列表和定義變量的數據都是尋求(海岸邊、資金來源等)和任何假設和簡化。

例子“信息提取從每個試驗包括:(1)試驗參與者的特征(包括年齡、舞台和疾病嚴重程度,方法診斷),和審判的納入和排除標準;(2)類型的幹預(包括類型、劑量、持續時間和頻率的非甾體抗炎藥(非甾體抗炎藥);與安慰劑或與類型、劑量、持續時間和頻率的另一種非甾體抗炎藥;或與另一個疼痛管理藥品;或於不采取任何治療措施);(3)類型的測量結果(包括減少疼痛的水平,改善生活質量評分(使用驗證範圍內),影響日常活動,缺席或學校工作,跟進的長度,意想不到的治療效果,許多女性需要更多侵入性治療)。”83年

解釋是很重要的讀者知道什麼信息審查作者尋求,即使其中一些信息是不可用的。84年如果審查僅限於報告隻獲得這些變量,而不是那些被認為重要,但不能獲得,偏見可能會引入和讀者可能誤導。因此幫助如果作者可以參考讀者協議(見第五項)和檔案提取形式(見項目10),包括變量的定義。發布的係統評價應該包括過程的描述,如果相關,規範的讀者可以獲得額外的材料。

我們鼓勵作者報告是否在評審開始加入了一些變量。這些變量可能包括那些在研究中發現,評論者標識(如重要成果的措施評論家最初被忽略)。作者應該描述的原因任何變量添加到那些已經預先確定的協議,以便讀者能理解評審過程。

我們建議作者報告任何假設他們缺失或不清楚信息和解釋這些過程。例如,在50歲以上女性的研究是合理的假設沒有懷孕,即使這不是報道。同樣,評論作者可能對藥物的給藥途徑做出假設評估。然而,應特別注意對定性信息進行假設。例如,較高的年齡限製為了減少“孩子”可以從15年21年有所不同,“激烈”理療可能意味著不同的事情不同的研究者在不同的時間和不同的病人,以及與“重”相關的血液量根據設置失血可能相差很大。

項目12:個人偏見的風險研究

描述方法用於風險評估個人偏見的研究(包括規範是否這樣做是在學習或結果層麵,或者兩者兼而有之),以及這些信息如何被用於任何數據合成。

例子“確定符合條件的隨機試驗的有效性,對評論者獨立工作和足夠的可靠性決定了隨機化的充分性和隱蔽的分配、致盲的患者,衛生保健提供者,數據收集器,和結果評估;和追蹤損失的嚴重程度(即比例的患者的調查人員無法確定結果)。”85年

“探索變化研究結果(異質性)之前我們指定以下假設進行分析。我們提出,效果可能不同的方法學質量的研究。”86年

解釋治療效果的可能性在係統回顧報告接近真相取決於包括研究的有效性,在一定的方法論特征可能與尺度效應有關。87年88年例如,試驗沒有足夠的報道平均分配隱藏誇大治療效果相比,那些有足夠的隱蔽。88年因此,重要的是作者描述任何方法,他們用來衡量偏差的風險beplay体育官网官方登录包括研究和信息技術是如何被使用的。89年此外,作者應該提供一個基礎,如果沒有偏見進行的風險評估。最流行的術語來描述與此項目相關的問題是“質量”,但在盒子的原因,闡述了4我們寧願這種產品名稱“風險評估偏見。”

許多方法存在偏見的整體風險評估包括研究,包括尺度、清單、和各個組件。90年91年正如盒4中所討論的,尺度數值總結多個組件到一個數字是誤導和無益的。92年93年相反,作者應該指定他們評估方法論的組件。常見的隨機試驗的有效性包括以下標記:適當的一代的隨機分配序列;94年分配序列的隱藏;93年炫目的參與者,衛生保健提供者,數據收集器,結果退休審核人員;95年96年97年98年比例的患者失訪;99年One hundred.停止試驗早期的好處;101年以及是否遵循意向處理分析原則。One hundred.102年最終決定,方法論的特性來評估需要考慮強度的經驗數據,理論基本原理,包括特殊環境下的研究。

作者應該如何評估風險報告的偏見;是否以盲目的方式;如果評估完成的不止一個人,如果是這樣,他們是否獨立完成。103年104年同樣,我們鼓勵作者報告任何校準完成演習評估團隊成員之間。最後,作者需要報告的評估偏差的風險是如何使用隨後在數據合成(見16項)。盡管常常困難的任務評估偏差的風險包括研究,作者有時沉默與結果評估他們所做的。89年如果作者排除研究的回顧或任何後續分析的基礎上,偏見的風險,他們應該告訴讀者研究排除並解釋原因除外責任(見第6項)。作者還應該描述任何計劃相關敏感性或子群分析偏差評估(見16項)。

項目13:總結措施

國家主要總結措施(如風險率、均數差)。

例子“相對死亡率降低風險的主要措施是治療效果。”105年

“執行的薈萃分析是計算相對風險(RRs)使用隨機模型。在意向性治療基礎上對定量分析和僅限於數據來源於後續的時期。RR和95%置信區間為每個副作用(以及所有副作用)計算了。”106年

“主要結果測量指標是平均差在日誌中10hiv - 1病毒載量比較補鋅安慰劑……”107年

解釋規劃係統回顧時,它通常是可取的,作者pre-specify主要關心的結果(見第五項)以及預期效果總結為每個結果測量。選擇摘要效應測量可能不同於用於包括的一些研究。如果可能應解釋影響措施的選擇,盡管它並不總是很容易提前判斷衡量是最合適的。

二進製的結果,最常見的總結措施的風險比,優勢比,和風險不同。108年相對比絕對一致的研究效果,影響109年110年雖然絕對差異很重要當解釋結果(見24項)。

連續的結果,自然效果測量是不同的。108年在所有研究結果時使用適當的測量是由相同的規模。使用標準化的差異意味著當研究不產生直接可比數據。這通常發生在所有研究評估相同的結果,但測量它以多種方式(如不同的尺度來衡量抑鬱)。

比較的結果,風險比是最常見的總結。評論家需要日誌風險比及其標準誤被包括在一個薈萃分析研究。111年這些信息可能不是給所有的研究,但方法可用於估算所需的數量從其他報告信息。111年風險率和比值比(相對於事件發生在一個固定的時間)不等同於風險比,和平均生存時間並不是一個可靠的薈萃分析的基礎。112年如果作者使用這些措施應該在報告中描述他們的方法。

14:項目計劃的分析方法

描述的方法處理數據,結合研究的結果,如果完成,包括措施的一致性(如我2為每一個薈萃分析)。

例子“我們測試的異質性Breslow-Day測試,並使用希金斯等人提出的方法測量不一致(總變異的百分比在研究由於異質性)在降脂幹預措施的效果。這種程度的不一致(稱為我的優點2本質上),它不依賴於許多研究,伴隨著不確定性區間。”113年

“在很少情況下,估計基線的意思或生命質量(生活質量)反應得到沒有相應的估計方差(標準差(SD)或標準錯誤)。在這些情況下,SD從已知的均值SDs估算。在許多情況下,響應數據的均值和方差在以前研究條件和治療。within-patient方差在這些情況下不能直接計算,近似假設的獨立。”114年

解釋從研究中提取的數據審查可能需要一些轉換(處理)之前適合分析或對證據表示在一個表中。盡管這些數據處理可以促進薈萃分析,有時需要即使薈萃分析還沒有完成。例如,在試驗中有超過兩個幹預組可能需要結合結果為兩個或兩個以上的團體(如接收相似但不同的幹預),或者它可能是可取的,隻包含數據的一個子集匹配審查的入選標準。當幾個不同尺度(如抑鬱)在研究中,使用一些分數可能需要逆轉的跡象,以確保所有尺度是一致的(比如如此低的值代表身體健康在所有尺度)。標準差可能不得不從其他數據如P值和重建t統計數據,115年116年或偶爾的估算標準偏差在其他研究中觀察到。117年比較數據也通常需要謹慎轉換為一致的格式。111年作者應該報告任何這樣的數據處理的細節。

統計數據的組合兩個或兩個以上的獨立研究分析可能是既無必要,也不可取(見框5和21項)。無論決定結合個人的研究結果,作者應該報告他們計劃如何評價之間的可變性(異構性或不一致)(6盒)。在試驗結果的一致性可能影響的決定是否結合試驗結果的薈萃分析。

薈萃分析完成時,作者應該指定效應測量(如相對風險或平均差)(見13項),統計方法(如逆方差),以及是否固定後果或隨機的方法,或其他方法(如貝葉斯)使用(見附表6)。如果可能的話,作者應該解釋這些選擇的原因。

在研究項15:偏見的風險

指定任何風險評估的偏差可能影響累積證據(如發表偏倚,選擇性報告研究)。

例子“為每個審判我們繪製的逆效應的標準誤差。對稱的漏鬥圖的視覺評估,並正式症的測試,看看效果隨樣本容量增加而降低。”118年

“我們評估發表偏倚的可能性,通過評估一個漏鬥陰謀審判意味著不同的不對稱,從而導致非出版物的小型試驗結果…因為圖形可以主觀的評價,我們也進行了一次調整等級相關測試和回歸不對稱測試正式發表偏倚的統計測試……我們承認,其他因素,如不同的審判質量和真正研究異質性,可能產生不對稱的漏鬥圖。”119年

解釋評論者應該探索可用的數據是有偏見的可能性。他們可能檢查的結果可用的研究線索表明可能有缺失的研究(發表偏倚)或丟失的數據包括研究(選擇性報告偏見)(見附表7)。作者詳細報告應該在研究任何方法用於調查可能的偏見。

很難評估within-study選擇性報告是否存在於一個係統的複習。如果個體研究的協議可用,協議和發表報告的結果可以比較。即使在沒有協議的情況下,結果中列出的方法部分可以與發表的報告結果。120年在196年隻有一半的試驗報告描述的比較兩種藥物在關節炎都影響變量方法和結果部分相同。82年在其他情況下,臨床知識的地區可能表明,測量結果很可能即使沒有報道。例如,在一個特定的疾病,如果兩個相互聯係的結果報告但另一個不是,然後一個人應該質疑後者被選擇性地忽略。121年122年

隻有36%(76 212)的治療係統的評論發表在2004年11月報道,發表偏倚的研究被認為是隻有四分之一的打算進行一個正式的評估偏差。324篇文章發表於2005年的60個薈萃分析中,正式的評估報告,大多數是基於少於10研究;大多數顯示顯著的異質性;和許多評論家誤解的結果測試工作。123年回顧抗抑鬱藥物的試驗發現,隻有發表試驗的薈萃分析了影響估計平均超過32%時發送到所有試驗藥物機構進行分析。67年

項16:額外的分析

描述額外的分析方法(如靈敏度或子群分析、多元回歸),如果做,表明預先確定。

例子“敏感性分析是預先確定的。治療效果根據質量檢查組件(隱蔽的治療分配、致盲的患者和照顧者,盲法評估結果),他汀類藥物的起始時間,和他汀類的類型。一個因果靈敏度分析進行了包括未發表的數據使用cerivastatin審判。”124年

解釋作者可能執行額外的分析來幫助理解他們的審查結果是否健壯,所有這些都應該報告。這些分析包括靈敏度分析、亞組分析和多元回歸。125年

敏感性分析是用來研究的主要發現的程度影響係統評價的變化方法或從各自的研究使用的數據(如研究入選標準,結果偏差的風險評估)。子群分析地址是否總結影響變化與特定的(通常是臨床)的特征包括研究或市場參與者。多元回歸亞組分析的概念擴展到考試的定量研究特點的影響效應大小。126年多元回歸也允許作者研究的貢獻不同的變量來研究結果的異質性。係統評價的讀者應該意識到多元回歸有很多限製,包括危險的深意的發現。127年128年

即使數據有限,許多可以進行額外的分析。選擇哪一種分析進行將取決於審查的目標。然而,這些分析是免除可能產生誤導的結果。重要的是告訴讀者這些分析,是否他們的理由,這是預先確定的。

結果

項17:研究選擇

給數字研究篩選,評估資格,並包括在審查,原因與排除在每個階段,理想的流程圖。

例子在文本:“總共有10個研究涉及13個試驗確定列入審查。Medline的搜索,PsycInfo Cinahl數據庫提供了總計584引用。調整後509年重複。其中,479年研究後被丟棄,因為回顧這些論文的摘要似乎顯然不符合標準。三個額外的研究…被丟棄,因為沒有全文的研究或論文不能真正地翻譯成英文。剩下的27的全文引用是更詳細地檢查了。似乎不符合入選標準的22項研究描述。5研究…滿足入選標準,包括在係統回顧。一個額外的5個研究……that met the criteria for inclusion were identified by checking the references of located, relevant papers and searching for studies that have cited these papers. No unpublished relevant studies were obtained.”129年

看到圖2流程圖

">Figure2

圖2研究選擇的流程圖。DDW =消化疾病周;聯合歐洲胃腸病學周UEGW =。改編自Fuccio et al130年

解釋作者應該報告,最好是流程圖,記錄的總數確定電子書目來源(包括專門的數據庫或注冊表搜索),手動搜索各種來源的引用列表,引證指標,和專家。是有用的,如果作者描繪為讀者所選文章的數量被確定的不同來源,這樣他們可以看到,例如,大多數文章是否被確認通過電子書目來源或從引用或專家。文獻識別主要從引用或專家可能傾向於引用或發表偏倚。131年132年

流程圖和文字應該描述清楚報告選擇整個複習的過程。作者應該報告唯一的記錄中確定搜索,記錄排除後初步篩選(如篩選標題和摘要),檢索報告的詳細評估,潛在的合格報告無法複原,檢索報告,不符合入選標準和排除的主要原因,包括在審查和研究。事實上,最合適的布局為不同的評論可能會有所不同。

作者也應該注意的存在重複或補充報告的數量,以便讀者理解個人研究與報道的數量,包括在審查中。作者應該使用一致的術語,如是否報道引用計數,記錄,出版物,或研究。我們相信報告的研究是最重要的。

一個流程圖可以非常有用;它應該描述的所有研究包括基於滿足合格標準,以及數據統計分析結合在一起了。回顧87年的係統評價發現,大約一半包括QUOROM流程圖。133年這項研究的作者建議的一些重要方麵,評論者可以提高使用流程圖在描述信息的流動在評審過程中,包括一個單獨的流程圖為每個重要的結果報道。133年

項18:研究特點

對於每一個研究,目前提取數據的特征(如研究大小,海岸邊,隨訪期間),並提供引用。

例子在文本:“包括研究的特點

方法

所有四個研究最終選擇評審都是用英語發表的隨機對照試驗。期間RIO-North美國的幹預是24個月和12個月RIO-Diabetes, RIO-Lipids和RIO-Europe研究。雖然最後兩個描述一段24個月期間進行,隻有第一個提供12個月的結果。所有試驗試車,作為一個隨機前盲目的時期。

參與者

包括研究涉及6625名參與者。主要的入選標準引起成年人(18歲以上),身體質量指數大於27公斤/米2,少於5公斤體重的變化在前三個月學習條目。

幹預

所有試驗都是男性。RIO-North美國是在美國和加拿大進行的,在歐洲和美國,RIO-Europe RIO-Diabetes在美國和其他10個不同國家,和RIO-Lipids八未指明的不同的國家。

幹預是安慰劑,5毫克利莫那班或20毫克利莫那班每天一次除了輕微hypocaloric飲食(600千卡/天赤字)。

結果

在所有研究主要結果評估從基線體重變化經過一年的治療和RIO-North美國研究還評估了第一和第二之間防止體重反彈。所有評價不利影響的研究,包括任何形式的和嚴重的事件。生活質量的測量在隻有一個研究中,但是結果並沒有描述(RIO-Europe)。

次要的和額外的結果

包括代謝綜合征患病率一年後和改變代謝疾病風險因素如血壓、血脂等。

沒有研究包括死亡率和成本的結果。

結果測量的時間變量,包括月度調查,評估每三個月或一個最終評估後一年。”134年

表:見表2

表2

的例子,總結研究特點:包括研究的總結評估止吐劑劑在急性胃腸炎的功效。改編自逃亡等135年

把這個表:

解釋為讀者來評估係統的有效性和適用性評審的結果,他們需要了解包括研究。這些信息包括海岸邊(2盒)和相關具體信息審查的問題。例如,如果審查檢查抗抑鬱藥物的長期影響,中度抑鬱症,作者應當包括後續時期的研究報告。對於每一個包括研究,作者應該提供一個引用來源的信息不管這項研究發表。這個信息讓有興趣的讀者更容易檢索相關的出版物或文檔。

報告學習水平數據還允許的主要特征的比較研究,包括審查。作者應該提供足夠的細節,讓讀者自行判斷包括的相關性研究。這些信息也可以讓讀者進行自己的子群分析和解釋子組,基於研究的特點。

作者應該避免,隻要有可能,假設信息缺失時從一個研究報告(如樣本大小,隨機的方法)。評論者可能接觸原始調查人員試圖獲取信息缺失或確認的數據提取係統的審查。如果沒有獲得這些信息,應在報告中注明。如果估算信息,讀者應被告知這是如何做的,哪些項目。展示學習水平數據可以清楚地識別未發表的信息從原始研究人員並使其可用於公共記錄。

一般來說,學習水平特點提出了作為表的示例(表2所示)。這樣表示確保所有相關的項目處理和信息缺失或不清楚注明。雖然基於論文的期刊一般不允許的數量信息在電子期刊或Cochrane綜述,這不應被接受為借口的遺漏重要的方麵包括研究的方法和結果,因為這些可以,如果有必要,在網站上。

每個包含研究的表示和描述後,正如上麵所討論的,審查員通常提供一個敘事研究的總結。這樣一個總結為讀者提供包括研究的概況。例如,它可能解決發表論文的語言,年出版,包括研究和地理起源。

海岸邊框架通常是有用的在報道敘述總結表明,例如,參與者的臨床特點和疾病嚴重程度和主要功能的幹預和對照組。對於後備的幹預措施,這可能有助於指定為每個研究幹預的關鍵元素接收到每組。全部細節包括幹預的研究被報道在隻有三個25係統評價相關慣例。84年

在研究項目19:偏見的風險

現在每個研究的數據偏差的風險,如果可用,任何產出水準評估(見項目12)。

例子見表3

表3

偏見的風險評估的例子:隨機對照試驗的質量措施,未能履行任何六有效性的標誌之一。改編自審視等96年

把這個表:

解釋我們建議審稿人評估偏差的風險包括研究使用一個標準的方法定義的標準(見12項)。他們應該報告任何此類評估的結果。89年

報告隻有彙總數據(如“兩個八個試驗充分隱藏分配”)是不夠的,因為它未能告知讀者研究的特定方法的缺點。一個更便捷的方式是顯式地報告每個研究的方法論特征評估。Cochrane協作的新工具來評估偏差的風險也要求作者證實這些評估與任何相關文本從原始研究。11通常是最容易提供這些數據以表格格式,如例子。然而,敘述總結描述表格數據也可以對讀者有用。

項20:個人研究的結果

所有結果(好處和壞處),現在,對於每一個研究,簡單的彙總數據為每個幹預組效應估計和置信區間,理想情況下森林圖。

例子見表4和圖3

">圖3

圖3的例子,總結結果:總體失敗(定義為分配方案的失敗或複發)與tetracycline-rifampicin和tetracycline-streptomycin。改編自Skalsky et al137年

表4

彙總結果的例子:在試驗比較放療和異位骨化的主要過程和髖骨骨折後非甾體抗炎藥。改編自Pakos et al136年

把這個表:

解釋從個人發表總結數據研究分析可以複製和其他調查分析和圖形顯示。其他人可能希望評估的影響排除特定的研究或不考慮子群分析審查報告的作者。顯示每個治療組包括研究的結果還支持個人研究的檢驗特性。例如,如果隻提供優勢比,讀者無法評估事件率的變化研究,使優勢比無法解釋。138年此外,由於數據提取錯誤薈萃分析是常見的,可以大139年從單個研究結果的表示更容易識別錯誤。連續的結果,讀者可能希望檢查一致性的標準偏差的研究,例如,放心,標準差和標準誤沒有困惑。138年

對於每一個研究中,每個幹預組的彙總數據為二進製的結果通常是給定頻率有和沒有的事件(或等比例12/45)。它是不夠的報告事件率每幹預組百分比。所需的彙總數據連續結果均值,標準差,並為每組樣本大小。在檢查比較數據的回顧,作者應該報告日誌風險比及其標準誤為每個包括研究(或置信區間)。有時候,重要數據丟失的報告包括研究和不能從其他數據計算,但可能需要估算的評論家。例如,標準偏差可能估算使用典型的標準差在另一個試驗116年117年(見項目14)。隻要有關,作者應該顯示結果沒有直接報道,必須從其他信息(見項目13)估計。此外,未發表的數據應該注意。

所有納入研究的特征是很重要的禮物與置信區間估計的影響。該信息可能包含在一個表顯示研究特征或森林圖所示。140年森林的關鍵元素情節效應估計和置信區間為每個研究顯示圖形,但最好也包括,為每一個研究中,數值類屬特異性的彙總數據,影響的大小和置信區間,重量百分比(見第二個例子,圖3所示)。討論的結果的薈萃分析,看到項21。

原則上,所有上述信息應提供每一個審查結果認為,包括利益和損害。當有太多的結果包含的完整信息,結果最重要的結果應該包括在主報告和其他信息提供一個web附錄。信息呈現應該合理的選擇根據原來規定的協議。作者應該明確提及如果計劃中的主要結果不能提出由於缺乏信息。有證據表明,危害信息在係統評價很少報道,即使是在原來的研究。141年危害結果的選擇性遺漏偏差係統回顧並減少導致知情決策的能力。

21項:合成的結果

目前的主要審查的結果。如果進行薈萃分析,包括為每個,置信區間和措施的一致性。

例子“死亡率數據對所有6個試驗是可行的,為305名患者隨機的311名患者和報告數據。沒有死亡報告的三個呼吸道合胞體病毒/重症毛細支氣管炎試驗;因此我們的估計是基於三個試驗隨機的232名患者,其中64人死亡。在彙總分析,表麵活性劑與死亡率顯著降低(相對危險度= 0.7,95%置信區間-0.97 = 0.4,P = 0.04)。沒有異質性(我的證據2= 0%)。”142年

“因為研究設計,參與者,幹預措施,並報告結果措施明顯不同,我們專注於描述研究,他們的研究結果,其適用性,及其局限性和定性綜合而不是薈萃分析”。143年

“我們發現顯著的異質性(我在這個比較2= 46.6%,χ2df = 7 = 13.11, P = 0.07)。回顧探索異質性的識別試驗,似乎不同於其他人。它隻包括小潰瘍(傷口麵積不到5厘米2)。排除這審判把統計學異質性,不影響任何證據的發現不同的凝膠之間的愈合率和簡單的低附著敷料(相對危險度= 0.98,95%置信區間0.85 - 1.12,我2= 0%)。”144年

解釋係統評價的結果應以有序的方式呈現。最初的敘述性描述的證據審查覆蓋(見項目18)可以告訴讀者研究人口和重要事情的設計和開展研究。這些描述可以方便的考試模式研究。他們也可能提供重要的信息適用性的證據,表明任何重大偏差的可能影響,並允許考慮,以一種係統化的方式,多種解釋的可能結果的差異研究。

如果作者有一個或多個進行薈萃分析,他們應該現在估計效應在研究結果的置信區間。通常是最簡單的顯示每一個薈萃分析總結的實際結果,包括研究森林圖(見項目20)。140年應該清楚的包括研究了每一個薈萃分析。作者還應該提供,對於每一個薈萃分析,測量結果的一致性的研究包括如我2(異構性,見盒6);置信區間也可以給這個措施。145年如果沒有進行薈萃分析,定性推論應該盡可能係統地提出的一個解釋為什麼沒有完成,薈萃分析在上麵的第二個例子。143年讀者可能會發現森林的情節,沒有總結估計,有用的在這種情況下。

報告一般應作者合成的結果測量他們著手調查(也就是說,那些描述的協議,請參見項目4)允許讀者得出自己的結論的影響結果。讀者應該意識到任何偏離計劃分析。作者應該告訴讀者,如果計劃薈萃分析並不認為適當的或可能的結果,這一決定的原因。

這可能並不總是明智的給薈萃分析結果為每個結果和森林的陰謀。如果評審地址一個廣泛的問題,可能會有大量的結果。同時,某些結果可能已報告在隻有一個或兩個研究中,在這種情況下,森林土地價值不大,可能嚴重的偏見。

Medline收錄的300係統評價2004年,一半多一點(54%)包括薈萃分析,其中絕大多數(91%)報告評估結果的不一致性。

22項:風險的偏見的研究

存在任何偏見的風險評估研究的結果(見第15項)。

例子”異質性(我的強有力的證據2= 79%,P觀察< 0.001)。探索這種異質性,漏鬥的陰謀。漏鬥圖(圖4所示顯示了相當大的不對稱的證據。”146年

">裝具

圖4漏鬥圖顯示的例子相當大的不對稱的證據。SE =標準誤差。改編自阿普爾頓等146年

“具體來說,四舍曲林試驗涉及486名參與者和一個西酞普蘭試驗274名參與者被報告為未能達到統計上顯著的藥物效果,沒有報告意味著HRSD漢密爾頓抑鬱量表評分。我們找不到數據從這些試驗中製藥公司網站或通過我們的搜索的文獻發表。這些遺漏代表舍曲林試驗中38%的患者和23%的患者在西酞普蘭試驗。分析有或沒有包含這些試驗沒有發現差異模式的結果;同樣,披露模式不與藥物類型。使用數據獲得FDA的目的是為了避免發表偏倚,包括未公開發表的試驗。隻包含那些舍曲林和西酞普蘭試驗了這意味著據報道,FDA將構成一種偏見報道類似於發表偏倚和為這些藥物會導致高估drug-placebo差異類型。因此,我們目前隻在數據分析完整的藥物臨床試驗報道“變革”。147年

解釋作者應該提供任何風險評估的結果偏差的研究。如果報告一個漏鬥圖,作者應該使用指定精確估計和測量的影響,提出了典型的x軸和y軸,分別。作者應該描述如果和他們如何測試任何可能的不對稱的統計意義(見第15項)。選擇性報告結果的任何調查的結果在研究15項(如前所述)也應報告。同時,我們建議作者告訴讀者如果任何預先確定的風險分析評估偏見研究沒有完成和原因(如包括研究太少)。

23項:額外的分析

給額外的分析的結果,如果完成(如靈敏度或子群分析、多元回歸(見項目16])。

例子“…benefits of chondroitin were smaller in trials with adequate concealment of allocation compared with trials with unclear concealment (P for interaction =0.050), in trials with an intention-to-treat analysis compared with those that had excluded patients from the analysis (P for interaction =0.017), and in large compared with small trials (P for interaction =0.022).”148年

“子群分析根據抗體狀態,抗病毒藥物,器官移植,治療持續時間、使用抗淋巴細胞療法,結果評估,研究質量和研究設計的其他方麵沒有展示任何治療效果的差異。多元多元回歸顯示,巨細胞病毒無顯著差異(巨細胞病毒)疾病後允許潛在的幹擾或影響使用預防性藥物,器官移植或收件人serostatus巨細胞病毒積極的接受者和巨細胞病毒巨細胞病毒的消極接受者積極捐贈。”149年

解釋作者應該報告任何子群或敏感性分析和他們是否預先確定(見項目5和16)。比較研究的亞組分析(比如低和高劑量阿司匹林)的分離研究,作者應該報告任何測試交互,以及估計和置信區間從薈萃分析在每個子群。同樣,多元回歸結果(見16項)不應局限於P值但應該包括效應大小和置信區間,150年上麵的第一個例子報道用表。包含在每個額外的數據量分析應該指定如果不同,考慮的主要分析。這信息是特別相關的敏感性分析,排除一些研究;例如,那些有偏見的風險很高。

重要的是,所有額外的分析應進行報道,而不僅僅是那些在統計學上意義重大。這些信息將幫助避免選擇性報告結果偏差在審查已經證明了隨機對照試驗的報告。4244121年151年152年探索性小組或敏感性分析的結果應該被謹慎,考慮潛在的多個分析誤導。

討論

24項:總結的證據

總結主要發現,包括證據的強度為每個主要結果;考慮他們的相關關鍵組(如衛生保健提供者、用戶和決策者)。

例子“總的來說,證據是不夠健壯的確定比較的有效性血管成形術(有或沒有支架)和醫療。隻有2的隨機試驗與長期結果和第三個隨機試驗,允許大量交叉治療3個月後直接血管成形術和醫療…隨機試驗相比不夠評估患者或沒有遵循病人足夠時間允許的結論對臨床結果,死亡率和心血管或腎衰竭等事件。

一些可接受的證據來自比較醫學治療和血管成形術長期腎功能的建議沒有區別,但是可能是更好的血壓控製血管成形術後,效果可能僅限於雙邊動脈粥樣硬化性腎動脈狹窄患者。關於其他結果是弱的證據。因為審查的研究並沒有明確地址快速臨床惡化患者可能需要急性幹預,我們的結論並不適用於這一重要子集的病人。”143年

解釋作者應該給出一個簡短的和平衡的性質和結果的總結回顧。有時候,結果很少或沒有數據被發現應該注意由於對政策決策和未來潛在的相關性研究。適用性評審的結果不同的病人,設置,或目標受眾示例應該被提及。雖然沒有標準的方法來評估適用性不同的受眾,同時一些係統確實存在。153年有時候,作者正式率或評估整體的證據審查和解決可以展示他們的總結與建議的強度評估質量的證據(如等級係統)。10

作者需要記住,統計學意義的影響並不總是建議臨床或政策的相關性。同樣,非重大的結果並不證明治療是無效的。作者應該明確權衡和價值觀如何連接到主要的結果會導致不同的人做出不同的決定。此外,熟練的作者是重要的考慮因素在翻譯的證據不同的設置和修改影響的評估報告的審核。153年病人和衛生保健提供者可能主要感興趣的幹預是最有可能為一個好處提供可接受的傷害,雖然決策者和管理者可能值數據組織的影響和資源利用率。

25項:限製

討論限製研究和成果水平(如風險的偏見),和在審查水平(如不完整的識別研究,檢索報告的偏見)。

例子結果水平:“這裏的薈萃分析報告在研究結合數據以估計治療效果比是可能的在一個單一的研究更精確。這個薈萃分析的主要限製,對於任何概述,是患者人群,抗生素療法,在研究結果的定義是不一樣的。”154年

研究和評估水平:“我們的研究也有一些局限性。不同的質量研究。在所有試驗隨機化是足夠的;然而,7的文章沒有顯式地聲明,堅持意向處理分析數據的原則,這可能導致高估這些試驗的治療效果和我們不能評估質量的4 5試驗報告的摘要。分析不確定組件之間的一個關聯的質量和re-bleeding風險,和支持聯合治療的效果仍然顯著,當我們排除試驗報告為抽象。

發表偏倚可能占了我們觀察到的一些影響。小試驗,一般來說,不如更大規模的研究方法論的嚴格分析,一個不對稱的漏鬥圖表明,選擇性報道可能導致過高的影響大小的小型試驗。”155年

解釋局限性的討論應該解決的有效性(即偏差的風險)和報告(信息量)的研究,包括評審過程的局限性,generalisability(適用性)的審查。讀者可能會發現它有用如果作者討論研究是否受到嚴重威脅的風險偏差,幹預的影響的估計是否太不精確,或如果有缺失數據對許多參與者或重要的結果。

限製搜索的審查過程可能包括限製(如限製英語出版物),以及任何困難選擇的研究中,評價和薈萃分析過程。例如,貧窮或不完整的報告的研究設計,患者群體,包括研究的幹預可能會妨礙解釋和合成。84年適用性的評估可能影響如果有有限的數據對某些人群或子組的幹預可能會執行不同的或感興趣的一些研究評估最重要的結果;或者如果有大量的數據與一個過時的幹預或比較器或嚴重依賴總結歸責缺失值估計(14項)。

26項:結論

提供一個通用的解釋結果的其他證據,並對未來的研究。

例子實踐意義:“從1995年到1997年,五個不同的薈萃分析抗生素預防感染和死亡率的影響發表。所有確認顯著減少感染,雖然效果的大小不同的從一個審查到另一個。估計影響總體死亡率明顯減少,產生了相當大的爭議成本效益的治療。中隻有一個可用的五個評論,然而,表明存在弱呼吸道感染和死亡率之間的聯係和缺乏足夠的統計能力,可能占有限影響死亡率。”

研究意義:“未來試驗的一個合乎邏輯的下一步將是該協議的比較方案的係統性抗生素劑隻有局部組件是否可以下降。我們已經確定了六個這樣的試驗,但病人的總數目前登記(n = 1056)太小我們相信這兩個治療同樣有效。如果假設因此被認為是值得測試更多的和更大的隨機對照試驗是必要的。這樣的試驗,但是,不會解決相關問題的治療誘導阻力。產生一個令人滿意的答案,研究用不同的設計將是必要的。盡管詳細討論超出了本文的範圍,研究重症監護室的而不是個別病人隨機單元和抗生素耐藥性的發生的監控在很長一段時間應該承擔。”156年

解釋係統的評論家有時過於樂觀的得出結論157年或不認真考慮危害同樣的好處,盡管一些證據表明這些問題減少。158年如果結論不能因為有可靠的研究太少,或者太多的不確定性,這應該說。這樣的發現可以從幾個大型研究發現一致的作用一樣重要。

作者應該試著與其他證據審查的結果,這有助於讀者更好的解釋結果。例如,可能還有其他係統評價的一般主題使用了不同的方法或解決相關但不同的問題。159年160年同樣的,可能會有額外的信息與決策者有關,如成本效益的幹預(如衛生技術評估)。作者可能的上下文中討論的結果審查現有證據關於其他幹預措施。

我們建議作者也明確對未來研究的建議。2535年樣本Cochrane綜述,包括82%的建議研究與特定的幹預措施,建議適當的類型的參與者,30%和52%的建議措施,未來的研究結果。161年沒有相應的評估係統的評論發表在醫學期刊上,但我們相信,這種建議是更常見的在這些評論。

臨床研究不應該計劃沒有全麵了解類似的,現有的研究。162年有證據表明,這仍然沒有出現,因為它和作者的主要研究不應該考慮係統回顧他們的設計研究。163年我們相信係統評價有指導未來的臨床研究潛力巨大。

資金

27項:資金

描述的資金來源或其他支持(如提供的數據)的係統綜述,係統回顧和資助者的角色。

例子“基於本文的證據合成是由疾病控製與預防中心的衛生保健研究和質量和美國預防服務工作小組”。164年

”角色的資金來源:資助者在研究設計沒有發揮作用,收集、分析、解釋數據,寫報告的,或決定提交投稿。他們不接受責任的內容。”165年

解釋作者的評論,像任何其他研究,應披露任何資助他們進行審查,如果評審不資助或狀態。Lexchin和他的同事們166年觀察到的結果的隨機試驗和臨床試驗的薈萃分析報告由製藥行業更有可能支持讚助商的產品與其他的資金來源與研究。類似的結果報告。167年168年類似的數據表明,類似的偏見可能影響係統評價的結論。169年

考慮到潛在的係統評價在決策中的作用,我們認為作者應該透明的資金和資助者的角色,如果任何。有時資助者提供服務,如圖書管理員完成搜索相關文獻或訪問商業評論家數據庫不可用。任何級別的資金或服務提供係統回顧團隊應該報道。作者也應報告資助者是否有任何角色的行為或報告審查。除了資金問題,作者應該報告任何真實的或者所感知到的利益衝突與他們的角色或資助者的角色相關的報告係統的審查。170年

300年的一項調查顯示,係統評價發表在2004年11月,在41%的資金來源沒有報告的評論。3隻有少數報告的評論(2%)資助的盈利來源,但真正的比例可能會更高。171年

額外注意事項non-randomised幹預研究的係統評價或其他類型的係統評價

棱鏡的聲明和本文檔集中在係統評價的隨機試驗的報告。其他的研究設計,包括non-randomised研究,準實驗研究,即,打斷了時間序列,包括在一些係統評價,評估醫療幹預措施的效果。172年173年這些評論可能不同的方法在不同程度的典型的幹涉檢查,例如關於文獻檢索,數據抽象,偏見的風險評估和分析方法。因此,他們的報告要求也可能不同於我們這裏描述。有用的原則是係統綜述作者報告,以確保他們的方法以足夠的清晰度和透明度使讀者能夠批判性的判斷或更新現有的證據和複製研究。

在一些係統的評論,作者將尋求原始數據從原始的研究人員計算彙總統計。這些係統評價稱為個別病人(或參與)數據審核。4041個體患者數據薈萃分析也可以進行與潛在的積累數據而不是回顧現有的數據積累。,額外的信息需要報道的方法。

其他類型的係統評價存在。現實主義審查的目的是確定複雜項目在特定的上下文和設置工作。174年敘事的證據審查的目的是解釋複雜的身體通過映射和比較不同的故事情節。175年網絡薈萃分析,也稱為多重治療薈萃分析,可用於分析的數據比較不同治療方法。176年177年他們使用的直接和間接的比較和可以用來比較幹預沒有直接比較。

我們相信,我們已經強調了本文相關的問題以確保透明度和理解的過程和信息的局限性提出了不同類型的係統評價。我們希望棱鏡可以更詳細的基礎指導其他類型的研究的係統評價,包括診斷準確性和流行病學研究。

討論

我們開發的棱鏡語句使用一個方法在這些年的發展方針,發展報告。178年棱鏡的總體目標是幫助確保報告的清晰度和透明度的評論,和最近的數據表明,該報告指導是急需的。3棱鏡並不打算成為一個質量評估工具,它不應該被使用。

這個棱鏡的解釋和細化文檔是為了方便理解,吸收,和傳播的棱鏡聲明,希望提供一個教學框架對於那些感興趣的進行和報告係統評價。它遵循的格式類似於在其他解釋性文件。171819建議在棱鏡後清單可能會增加係統回顧報告的字數。然而,我們相信,讀者的利益能夠批判性地評價一個清晰的、完整的、透明的係統回顧報告超過了報告的長度可能輕微增加。

而棱鏡的目的是減少缺陷的風險報告係統評價和提高清晰度和透明度如何進行評論,我們沒有數據狀態更加明確地這個“幹預”是否實現其預期目標。之前的努力評估QUOROM沒有成功完成。178年QUOROM聲明的發布被推遲了兩年,一個研究小組試圖進行隨機對照試驗評估其有效性的八個主要醫學期刊的參與。不幸的是試驗沒有完成由於權責發生製問題(大衛·莫赫個人通信)。其他評價方法可能更容易進行。至少一個公布的139年調查急救護理文獻的係統評價179年表明其質量改善QUOROM出版後。

如果棱鏡語句認可和遵守期刊,其他報告指南,171819180年應該有改進報告係統評價的證據。例如,有一些評估是否使用配偶提高隨機對照試驗的報告。這些研究的係統評價181年表明使用配偶與改善報告的某些項目,如分配隱藏。我們的目標是評估的好處(即改進的報告)和可能的不利影響(如增加單詞長度)棱鏡,我們鼓勵其他人考慮做同樣的事情。

即使我們沒有進行係統的文獻檢索來生產我們的清單,這的確是一個限製我們的努力,棱鏡是盡可能采用基於證據的方法。清單項目包括如果有證據表明不報告項目與風險增加有關的偏見,或很明顯,信息是必要的,以評估評估的可靠性。保持更新棱鏡和盡可能的基於證據的要求定期警惕的文學,這是快速增長。目前Cochrane方法注冊有超過11 000條記錄有關的行為和報告係統評價和其他評估健康和社會保健。對於一些清單項目,比如報告摘要(項目2),我們使用來自其他地方的證據相信這個問題同樣適用於係統評價報告。然而,其他物品,證據不存在;例如,訓練是否能夠提高數據提取的準確性和可靠性。我們希望棱鏡作為催化劑時幫助生成進一步的證據,可以考慮在未來進一步修改清單。

有超過10年的發展之間傳遞QUOROM聲明及其更新,棱鏡的聲明。我們的目標是更頻繁地更新棱鏡。我們希望棱鏡的實現將會比它已經QUOROM。至少有兩個理由保持樂觀。首先,越來越多地采用係統評價醫療服務提供者通知“最佳實踐”病人護理。政策分析師和經理使用係統評價告知醫療決策和更好的未來的研究目標。第二,我們預期受益於赤道的發展網絡,下麵描述。

開發任何報告準則需要相當大的努力,經驗,和專業知識。雖然報告指南已經成功的一些個人的努力,171819有可能其他人想要發展報告準則擁有一些時間,經驗,或知識如何適當地這樣做。赤道(加強衛生研究的質量和透明度)網絡旨在幫助個人和團體感興趣的同學,作為一個全球資源開發報告指南,無論焦點。7180年182年赤道的總體目標是提高報告的質量所有健康科學研究的發展和翻譯報告指南。超越這一目標,網絡計劃開發一個大型網站開發和維護資源中心的報告工具,報告研究和其他信息(www.equator-network.org/)。

我們鼓勵醫療期刊和編輯組織,如世界醫學協會編輯和國際醫學期刊編輯委員會,支持棱鏡一樣他們支持其他報告指南,如配偶。我們也鼓勵醫療期刊的編輯支持棱鏡更新他們的“作者”,包括棱鏡網址,和提高意識通過特定的編輯操作。

箱1:術語

使用的術語來描述係統評價和薈萃分析的發展隨著時間的推移和之間的不同領域。不同的條款已被不同的團體,比如教育家和心理學家。係統回顧的行為由幾個明確的和可再生的步驟,如識別所有可能相關的記錄,選擇符合條件的研究,評估偏差的風險,提取數據,包括定性的綜合研究和薈萃分析。

最初的整個過程稱為薈萃分析,所以QUOROM語句中定義。8最近,尤其是在醫療研究,有趨勢傾向於係統綜述。如果執行定量合成,這最後階段單獨稱為一個薈萃分析。Cochrane協作使用這個術語,9下一個薈萃分析,如果執行,係統回顧的一個組成部分。不管問題和複雜問題的解決,它總是可以完成係統回顧現有的數據,但並不總是可能的或可取的,因為臨床定量合成的結果,包括研究方法論,或統計差異。相反,與潛在的研究和數據積累計劃最終將他們的,“(潛在)薈萃分析”這個詞可能比“係統綜述。”更有意義

回顧工作,一種可能性是使用術語係統回顧整個過程到當一個人決定是否執行定量合成。如果執行定量合成,一些研究人員將這稱為一個薈萃分析。這個定義類似於當前的版本字典的流行病學183年

雖然我們認識到,這些術語的使用是不一致的,剩餘工作小組的成員之間的分歧在棱鏡上,我們采用了使用的定義Cochrane協作。9

係統綜述係統回顧嚐試所有的經驗證據收集符合預先確定合格標準回答一個特定的研究問題。選擇它使用顯式的、係統的方法,以減小偏差,從而提供可靠的研究結果可以得出的結論和決定。184年185年係統回顧的關鍵特點是(一個)一套明確的目標與一個明確的、可再生的方法;(b)係統搜索,試圖識別出所有的研究,將滿足合格標準;(c)的評估包括研究的結果的有效性,如通過偏見的風險評估;和(d)係統演示和合成的特點和研究包括研究。

薈萃分析薈萃分析是使用統計技術整合和總結了研究的結果。許多係統評價包含薈萃分析,但不是全部。從所有相關的研究,結合信息薈萃分析可以提供更精確的估計的影響比來自個人醫療保健研究包括在審查。

框2:幫助開發研究的問題(s):海岸邊的方法

製定相關的和精確的問題,可以回答在係統回顧可以複雜和耗時。結構化方法的框架問題,使用五個組件可以幫助促進這一過程。這種方法通常以每個字母縮寫“海岸邊”,指的是一個組件:患者人群或疾病被解決(P),幹預或暴露(I),比較器組(C)、結果或端點(O),選擇的研究設計。186年相關問題的海岸邊影響棱鏡幾個項目(項目6、8、9、10、11日和18)。

  • P -提供信息的人口需要的精確定義的一組參與者(通常是病人),如男性年齡在65年,他們感興趣的特征(通常是疾病),和可能的設置護理,如急性護理醫院。

  • 我- - - - - -幹預措施(曝光)正在考慮在係統回顧需要透明的報道。例如,如果審查員回答一個關於一個女人之間的關係問題的產前接觸葉酸和隨後的後代的神經管缺陷,報告劑量、頻率和持續時間的不同研究中使用葉酸可能重要的讀者解釋評審的結果和結論。其他幹預(曝光)可能包括診斷、預防、治療或治療;安排具體的護理流程;生活方式的改變;心理或教育幹預;或危險因素。

  • C -清楚報告比較器(控製)組幹預(s)——比如常規治療,藥物或安慰劑是必不可少的讀者完全理解的選擇標準主要包括在係統綜述的研究,並且可能是異質性的來源調查人員必須處理。比較器描述往往不佳。清楚報告的幹預而很重要,有時可能會產生影響的研究在review-many評論與“標準治療,”否則定義;這應該是作者妥善解決。

  • O -幹預的結果被assessed-such死亡率、發病率、症狀、生活質量改進需要被明確指定為他們被要求解釋的有效性和generalisability係統回顧的結果。

  • S -最後,研究設計的類型(s)包括在審查應該報道。一些評論隻包括隨機試驗的報告,而其他人更廣泛的設計標準,包括隨機試驗和某些類型的觀察性研究。還有其他評論,比如專門回答問題與傷害有關,可能包括各種各樣的設計從隊列研究案例報告。無論研究設計是包括在審查,這些應該報道。

獨立於有多難確定研究問題的組件,重要的是一個結構化的方法是可取的,這超越了係統評價的有效性。理想的海岸邊的標準應該預先製定,係統回顧的協議,雖然有些可能需要修正的迭代特性評審過程。作者鼓勵報告他們的海岸邊標準及是否需要在評審過程中進行修改。一個有用的例子在這個領域的附錄“水氟化反應的係統評價”進行評論和傳播的中心。187年

盒3:識別的研究報告和數據提取

綜合搜索通常導致大量的識別記錄,數量小得多的研究包括在係統回顧,和更少的這些研究包括薈萃分析。係統評價的報道經常提供小細節的方法在這個過程中由評審小組。讀者往往剩下什麼可以被描述為“x檔案”的現象,因為它是不清楚發生在初始確認記錄和最後審查中。

有時,審查報告隻是作者的數量包括研究;通常他們報告的初始數量確認記錄,包括研究的數量。很少,雖然這是讀者最優,做評論作者報告確認記錄的數量,數量小的潛在的相關研究,包括研究的更小的數量,結果。評論作者還需要區分和研究報告的數量。通常不會有1:1比例的報告中描述的研究和信息需要係統綜述報告。

理想情況下,識別研究報告應報告為文本結合使用棱鏡流程圖。雖然我們建議使用流程圖,少量的評論可能是特別簡單,可以充分描述文本的一些簡短的句子。更普遍的是,審查報告需要作者每一步的過程:檢查確認記錄;檢查潛在的相關研究的全文(和報告無法獲得);和應用包括合格標準選擇研究。

這樣也應該詳細描述如何可能符合條件的記錄被提升為下一階段的評審(如全文篩選),這一過程的最後階段,包括研究。經常回顧團隊有三個回答選項排除記錄或促進他們的下一個階段風選過程:“是的,”“不,”和“也許”。

同樣,一些細節應該參與報道,這些過程是如何完成的。例如,一個人可能屏幕識別記錄,而一個人獨立檢查的小樣本。整個篩選過程是“好簿記”之一,有興趣的讀者應該能夠從工作包括研究提出相同的數量的確認記錄。

通常會有缺乏信息描述數據提取流程在係統評價的報道。作者可能隻是報告,“相關”數據提取從每個包括研究很少用於數據提取信息的過程。它可能是有用的為讀者知道係統綜述的作者,先天的,數據提取形式,是否使用,多種形式的數量問題,形式是否試點測試,完成了提取。例如,重要的是讓讀者知道一個或更多的人提取的數據,如果是這樣的話,這是否獨立完成,是否“共識”中使用的數據分析,如果審查小組完成了一個非正式的培訓鍛煉或更正式的可靠性。

箱4:研究質量和風險的偏見

在本文中,和其他地方,11我們試圖用一個新的術語對許多讀者來說,即偏差的風險,評估每一個包括在係統回顧研究。以前的論文89年188年傾向於使用術語“質量。“當進行係統回顧我們認為重要的是要區分質量和風險的偏見和專注於評估和報告。質量通常是最好的作者已經能夠做的。例如,作者可能報告手術試驗的結果,炫目的評估結果不屬於審判的行為。盡管這可能是最好的方法研究人員能夠做的,還有理論理由相信這項研究是容易(風險)的偏見。

評估偏差的風險應該實施和報告的一部分,任何係統的審查。在所有情況下,我們鼓勵係統的評論者之前仔細思考偏見的風險(方法學和臨床)可能會影響他們的係統評價的結果。

係統的評論者,理解偏差的風險研究的結果往往是困難的,因為該報告隻是一個代理的實際進行研究。有一些建議189年190年報告可能不是一個合理的研究的傳真,盡管並非所有人都持這種觀點。88年191年有三個主要的方法來評估風險bias-individual組件,檢查清單和尺度。有一個偉大的許多可用的尺度,192年盡管我們警告他們使用的理論依據193年和新興的經驗證據。194年清單不太常用的和潛在的有相同的問題。我們提倡使用一個組件的方法和基於領域有良好的經驗證據和可能強烈的臨床依據。新Cochrane偏見的風險工具11就是這樣一個組件的方法。

Cochrane偏見的風險工具包括五個項目的經驗證據的偏壓影響幹預的有效性的估計隨機試驗(序列生成、分配隱藏、炫目,不完整的結果數據,和選擇性的結果報告)和全方位項目稱為“其它來源的偏見”。11也有一些共識,這些項目可以申請評估研究跨不同臨床領域。93年其他偏見的風險項目可能的話題甚至研究特別,他們可能來自一些特殊性的研究主題或特定的設計的一些特殊特性研究。這些特點需要調查在個案基礎上,根據臨床和方法論的智慧,就不會有一般的食譜。在所有情況下,係統的評論者需要之前仔細考慮哪些方麵研究質量的可能影響結果。

箱5:是否合並數據

決定是否把數據包括統計、臨床和方法學方麵的考慮。統計決策可能是最技術和以證據為基礎的。這些是更徹底地討論盒6。臨床和方法論的決策一般基於審查小組內討論和可能更主觀。

臨床考慮將受到審查試圖解決的問題。廣泛的問題可能會提供更多的“許可證”將更多的不同的研究,如“利他林是否有效地提高集中注意力在人們診斷出患有注意缺陷多動障礙(ADHD)。“這裏作者可能選擇結合涉及兒童和成人的研究報告。如果臨床問題是更有針對性,比如是否“利他林是有效提高課堂注意力在以前未確診的ADHD兒童沒有並存狀況,“很可能不同的決定關於合成是由作者的研究。在任何情況下作者應該描述他們的臨床決策係統綜述報告。

決定是否合並數據還有一個方法論的組件。評論者可能決定不結合研究的低風險偏差與高風險的偏差(見項目12和19)。例如,對於主觀結果,係統綜述的作者可能不希望結合評估,在盲目的情況下,那些沒有完成。

任何特定的問題可能沒有一個“正確”或“錯誤”的選擇關於合成,這樣的決定可能是複雜的。然而,隨著選擇可能是主觀的,作者應該透明的關鍵決策並為讀者描述它們。

箱6:薈萃分析和評估的一致性(異質性)

薈萃分析:統計結合多個研究的結果

如果是覺得應該研究他們的結果統計相結合,必須考慮其他問題,因為有很多方法進行薈萃分析。不同的影響措施可用於二進製和連續的結果(參見條目13)。同樣,有兩種常用的統計模型結合數據的薈萃分析。195年那裏的固定效應模型假定所有包括研究是一種常見的治療效果;196年假定觀察到的差異在研究結果反映隨機變化。196年隨機模型假定沒有常見的治療效果,而是包括所有研究的差異影響跨研究遵循一個特定的分布。197年在隨機模型相信包括研究表示隨機樣本從一個更大的人口研究解決問題的興趣。198年

沒有共識是否使用固定或隨機影響模型,並都在廣泛使用。下麵的差異影響了它們之間的一些研究人員對他們的選擇。隨機模型給小試驗的結果更多的重量比固定效應分析,這可能是不受歡迎的小型試驗可能不如和最容易發表偏倚。固定效應模型隻考慮within-study可變性,而隨機影響模型考慮內部和之間的差異性。這就是為什麼一個固定效應分析往往給窄置信區間(即提供更精確)比隨機分析。110年196年199年在沒有任何學術研究的異質性,固定和隨機估計一致。

此外,還有不同的方法來執行這兩種類型的薈萃分析。200年常見的固定效應方法是Mantel-Haenszel和逆方差,而隨機分析通常使用DerSimonian和Laird的方法,盡管存在其他方法,包括貝葉斯薈萃分析。201年

存在明顯的之間的異質性(見下文),有些人認為,使用固定效應分析是違反直覺的,因為他們的主要假設是違反了。另一些人認為它是不進行任何分析試驗結果當有不明原因的可變性。如果評審人員決定不把數據定量,危險在於,最終他們可能使用quasi-quantitative可憐的有效性規則(如投票數有多少研究名義上重要的結果)解釋的證據。結合數據統計方法存在任何可能出現的複雜情況在係統回顧,但是必須意識到自己的假設和限製,以避免誤用或曲解這些方法。

評估的一致性(異質性)

我們希望一些變異(不一致)在不同研究的結果由於單獨的機會。變化的,由於機會反映真實試驗結果的差異,並被稱為“異質性。“傳統的統計方法評估異質性是一個χ2測試(科克倫的Q),但它有低功率時很少有研究和過度的權力有許多研究。202年相比之下,我2統計量化的變化量超出預期的結果在研究機會,所以比Q。202年203年2代表總數的百分比變化效應在研究估計,由於非均質性,而不是機會;一些作者考慮一個我2值小於低25%。202年然而,我2還患上大常見情況,隻有少數研究的不確定性,204年和報告我的不確定性2(95%置信區間等)可能是有益的。145年當有一些研究,推斷異質性應該謹慎。

觀察到相當大的異質性時,建議考慮可能的原因。205年特別是,異質性可能是由於子組之間的差異的研究(見16項)。同時,數據提取錯誤的常見原因異質性在結果與連續的結果。139年

箱7:偏見引起的選擇性出版或在研究結果的研究

係統評價的目標是將所有相關的信息的研究。從一些研究缺乏信息可能構成嚴重威脅評估的有效性。的數據可能是不完整的,因為一些研究沒有發表,或因為不完整或不報告發表的一篇文章。這些問題經常被概括為“發表偏倚,“雖然充分研究和選擇性的偏見起源於幹脆不出版的結果與他們的發現。研究成果的幹脆不依賴於實際結果偏差的風險是一個重要的係統回顧和薈萃分析。

缺失的研究

幾個實證調查表明,臨床試驗的結果更有可能發表如果結果具有統計學意義(P < 0.05)比如果他們不是。125年206年207年例如,500年腫瘤試驗超過200名參與者的初步結果的美國臨床腫瘤學會的一次會議上,81%,P < 0.05發表在五年內全麵相比隻有68%的P > 0.05。208年

已發表的研究中,那些有統計上顯著的結果比那些更早發表非重大的發現。209年當這些原因,一些研究缺少可用的結果將偏向誇大幹預的效果。

丟失的結局

在許多係統評價,隻有一些合格的研究(通常是少數)可以包含在一個薈萃分析為一個特定的結果。一些研究結果可能不是測量或測量而不是報道。前者不會導致偏見,但後者。

證據積累的選擇性報告偏見是普遍的和相當大的重要性。4243此外,數據對於一個給定的結果可能以多種方式分析和演示的影響結果的選擇。102年的一項研究,隨機試驗,比較試用協議發表的報告顯示,平均38%的功效和50%安全每試驗結果,分別是不能用於分析。統計上顯著的結果有更高的幾率被充分發表在出版物相比,非重要結果的有效性(集中優勢比為2.4(95%可信區間1.4到4.0))和安全(4.7(1.8 - 12))的數據。其他研究也有類似的發現。210年211年

發現缺失的信息

失蹤的研究也日益被從試驗注冊。失蹤的證據,結果可能來自與研究協議,如果可用,或發表文章的仔細檢查。11研究發表偏倚和選擇性報告結果很難排除或從可用的驗證結果,特別是在一些研究是可用的。

如果可用的數據也影響(或兩者)的偏見,較小規模的研究將會展示出更大的幹預的影響的估計。因此一種可能性是,調查影響大小和樣本大小之間的關係(或者更確切地說,效果估計的精度)。圖形化方法,尤其是漏鬥圖,212年的測試和分析方法(如Egger)是經常使用,213年214年215年盡管他們的解釋可以是有問題的。216年217年嚴格地說,這樣的分析調查“小型研究偏見”;原因可能有很多小比更大的研究,係統地研究不同尺度效應的報告偏見隻是其中一個。218年幾種不同的測試偏差也提出,除了測試小書房的偏見,215年219年220年但是沒有一個可以被認為是黃金標準。盡管證據表明,較小規模的研究估計效果比大公司可能會建議現有證據的可能性是有偏見的,這些數據是常見的誤解。123年

筆記

引用這個:BMJ2009;339:b2700

腳注

  • 下麵的人導致了本文:道格•奧特曼醫學統計中心(英國牛津大學);Gerd,弗萊堡大學醫院(德國弗萊堡);大衛·阿特金斯衛生服務研究和開發服務,退伍軍人健康管理局(美國華盛頓特區);弗吉尼亞巴伯,《公共科學圖書館·醫學》雜誌上(英國劍橋);尼克叫賣小販,東安大略省兒童醫院(加拿大渥太華);傑西柏林,強生製藥研發(美國泰特斯維爾新澤西);Jocalyn克拉克《公共科學圖書館·醫學》雜誌上(在撰寫本文時,BMJ、倫敦);英國Cochrane中心邁克•克拉克(英國牛津大學)和護理和助產學學院的三一學院(愛爾蘭都柏林);黛博拉·庫克,醫學、臨床流行病學和生物統計學,麥克馬斯特大學(加拿大漢密爾頓市);羅伯特·D中保,意大利迪摩德納e Reggio Emilia(意大利摩德納)和Centro Cochrane意大利語,史Ricerche Farmacologiche馬裏奧·內格裏(意大利米蘭);喬納森•J Deeks伯明翰大學(伯明翰);P J審視,醫學、臨床流行病學和生物統計學,麥克馬斯特大學(加拿大漢密爾頓市);凱Dickersin,約翰霍普金斯大學彭博公共衛生學院(美國馬裏蘭州巴爾的摩);馬提亞Egger)社會預防醫學,大學伯爾尼(瑞士伯爾尼);,Edzard Ernst半島醫學院(英國埃克塞特);彼得·C Gøtzsche北歐科克倫中心(丹麥哥本哈根); Jeremy Grimshaw, Ottawa Hospital Research Institute (Ottawa, Canada); Gordon Guyatt, Departments of Medicine, Clinical Epidemiology and Biostatistics, McMaster University; Julian Higgins, MRC Biostatistics Unit (Cambridge, UK); John P A Ioannidis, University of Ioannina Campus (Ioannina, Greece); Jos Kleijnen, Kleijnen Systematic Reviews (York, UK) and School for Public Health and Primary Care (CAPHRI), University of Maastricht (Maastricht, Netherlands); Tom Lang, Tom Lang Communications and Training (Davis CA, USA); Alessandro Liberati, Università di Modena e Reggio Emilia (Modena, Italy) and Centro Cochrane Italiano, Istituto Ricerche Farmacologiche Mario Negri (Milan, Italy); Nicola Magrini, NHS Centre for the Evaluation of the Effectiveness of Health Care—CeVEAS (Modena, Italy); David McNamee,《柳葉刀》(英國倫敦);大衛·莫赫渥太華方法中心,渥太華醫院研究所(加拿大渥太華);洛倫佐泥熔岩,Centro Cochrane犬,史Ricerche Farmacologiche馬裏奧·內格裏;瑪麗安那不勒斯,醫療中心的消費者(美國紐約);辛西婭·Mulrow內科醫學年鑒(美國賓夕法尼亞州費城);安迪·奧克斯曼挪威衛生服務研究中心(挪威奧斯陸);英航的範教授、多倫多健康經濟學和技術評估協作(加拿大多倫多)(集團第一次會議的時候,葛蘭素史克加拿大、米西索加,加拿大);德拉蒙德蘭尼,加州大學舊金山(美國舊金山CA);瑪格麗特•桑普森東安大略省兒童醫院(加拿大渥太華);肯尼斯·舒爾茨,家庭健康國際(達勒姆數控、美國);保羅•G Shekelle南加州循證實踐中心(美國聖塔莫尼卡CA);泰茲拉夫詹妮弗,渥太華方法中心,渥太華醫院研究所(加拿大渥太華);大衛•ToveyCochrane圖書館Cochrane協作(英國牛津大學)(集團第一次會議的時候,BMJ、倫敦);人口健康研究所的彼得•特格韋爾渥太華大學(加拿大渥太華)。

  • 洛倫佐泥熔岩幫助準備和幾個更新的手稿並協助準備的引用列表。艾爾是擔保人的手稿。

  • 利益衝突:沒有宣布。

  • 出處和同行評審:不是委托;外部同行評議。

  • 為了鼓勵傳播棱鏡的聲明,本文是自由訪問bmj.com並還將發表在《公共科學圖書館·醫學》雜誌上,內科醫學年鑒,臨床流行病學雜誌,開放的醫學。本文作者聯合舉辦的版權。用於進一步的細節,請參見棱鏡網站(www.prisma-statement.org/)。

這是一個開放分布式根據條創作共用署名非商業性的許可證,允許無限製的使用,分布,在任何介質,和繁殖提供了最初的工作是正確引用。

引用

視圖抽象
Baidu
map