用於醫療保健專業人員

CC通過數控開放獲取
研究方法和報告

配偶2010解釋和闡述:更新指南報告平行組隨機試驗

BMJ2010年;340年doi:https://doi.org/10.1136/bmj.c869(2010年3月24日發表)引用這個:BMJ2010;340:c869

這篇文章有一個修正。請參閱:

  1. 大衛·莫赫資深科學家1,
  2. 莎莉霍普韋爾,高級研究員2,
  3. 肯尼斯·F舒爾茨傑出的科學家和副總統3,
  4. 維克多Montori醫學教授4,
  5. 彼得·C Gøtzsche主任5,
  6. P J審視中國、臨床學者6,
  7. 戴安娜Elbourne教授醫療評估7,
  8. 馬提亞症主管部門和流行病學和公共健康教授8,
  9. 道格拉斯·G奧特曼教授,2
  1. 1渥太華方法中心、臨床流行病學項目、渥太華醫院研究所,渥太華,加拿大安大略省渥太華醫院K1H 8 16種
  2. 2牛津大學醫學中心統計,沃爾夫森學院,牛津大學
  3. 3家庭健康國際,美國27709年數控,三角研究園
  4. 4英國知識和遇到的研究單位,梅奧診所,錳、美國羅徹斯特
  5. 5北歐科克倫中心、Rigshospitalet Blegdamsvej 9,丹麥哥本哈根
  6. 6加拿大漢密爾頓市麥克馬斯特大學健康科學中心
  7. 7醫療統計單位,倫敦衛生和熱帶醫學學院的倫敦
  8. 8社會預防醫學研究所(重點),瑞士伯爾尼大學
  1. 函授:D勝景一覽無餘dmoher在{}ohri.ca
  • 接受2010年2月8日

文摘

壓倒性的證據顯示隨機對照試驗的質量報告(相關的)不是最優的。沒有透明的報道,讀者無法判斷試驗結果的信度和效度,也為係統評價提取信息。最近的方法論的分析表明,報告和設計不足與偏差估計的治療效果。這樣的係統誤差是嚴重損害相關,這被認為是黃金標準評估幹預措施,因為它們能夠減少或避免偏見。

一組科學家和編輯了配偶(合並報告的標準試驗)相關的語句來提高報告的質量。這是首次出版於1996年,2001年更新。聲明由一個清單和流程圖,作者可以使用一個隨機對照試驗報告。許多著名醫學期刊和重大國際編輯組織支持CONSORT聲明。聲明有助於相關的關鍵評價和解釋。

在2001年的配偶修訂,顯然,解釋和精化的CONSORT聲明背後的原則將有助於調查人員和其他人寫或評價試驗報告。配偶的解釋和細化的一篇文章發表在2001年與2001年版的CONSORT聲明。

專家會議後在2007年1月,CONSORT聲明進一步修訂,作為配偶2010年發表的聲明。這個更新改善以前的清單和包含的措辭和清晰建議相關話題,最近才收到識別,如選擇性報告結果偏差。

這說明和細化文件加強使用,理解,和傳播的配偶聲明也被廣泛地修改。這禮物的意義和理由每個新的和更新的清單項提供良好的報告和例子,在可能的情況下,引用相關的實證研究。包括幾個流圖的例子。

2010年配偶聲明,這個修改說明和細化文檔,和相關的網站(www.consort-statement.org)應該有用的資源來提高隨機試驗的報告。

“整個醫學取決於透明的報告的臨床試驗。”1

精心設計,妥善執行隨機對照試驗(相關的)提供最可靠的醫療幹預措施的有效性的證據,但是不足的試驗方法與偏見,尤其是誇大治療效果。2345偏置設計不良的結果和報告試驗可以在各級衛生保健誤導決策,為病人製定治療決策的國家公共衛生政策。

臨床試驗質量的關鍵評估可能隻有設計、行為,分析相關的徹底和準確地描述在報告中。遠不是透明的,相關的報道常常是不完整的,6789複利問題引起的可憐的方法。101112131415

不完整和不準確的報告

許多評論記錄缺陷的臨床試驗報告。例如,信息方法用於試驗分配參與者比較組織曾在519年隻有21%的試驗報告2000年在PubMed索引,16在2006年,隻有34%的616份報告索引。17同樣,隻有45%的試驗報告2000年在PubMed索引16和2006年的53%17定義了一個主要終點,隻有27%在2000年和2006年的45%報告樣本大小的計算。報告不僅是經常不完整但有時也不準確的。119年的報告稱,所有與會者都包含在分析的組織最初分配(意向處理分析),15(13%)排除患者或不分析所有患者分配。18許多其他評論發現,報告不足是常見的在專業期刊上1619和期刊發表在除英語之外的其他語言。20.21

適當的隨機化減少選擇偏倚在試驗條目和高品質相關的關鍵組件。22隨機的成功取決於兩個步驟:一代的不可預知的分配序列和隱藏這個序列的調查人員招收參與者(見附表1)。223

箱1:治療分配。隨機有什麼特別之處?

該方法用於分配幹預試驗參與者是臨床試驗設計的一個至關重要的方麵。隨機分配是首選方法;它已經成功地在實驗中經常使用超過50年。24隨機有三大優勢。25首先,當正確實現,它消除了選擇性偏差,平衡這兩個已知的和未知的預後因素,分配的治療。沒有隨機,治療比較可能是偏見,無論自覺與否,通過選擇參與者的一種特殊接受特別治療。第二,隨機分配許可使用概率論來表達的可能性,任何幹預組之間差異的結果隻是反映了機會。26第三,隨機分配,在某些情況下,促進致盲治療研究者的身份,參與者和評價者,可能通過使用安慰劑,這樣可以減少偏見後分配的治療。27這三個優勢,減少選擇偏倚在試驗條目通常是最重要的。28

在實踐中成功的隨機取決於兩個相互關聯的aspects-adequate代不可預知的分配順序的序列和隱藏,直到作業發生。223一個關鍵問題是時間表是否已知或可預見的人參與分配參與者的比較組。29日因此治療分配製度應該建立這樣的人提前入學參與者不知道治療下一個人會得到,一個過程稱為分配隱藏。223合理配置隱藏盾牌的知識即將到來的任務,而適當的隨機序列正確預防未來任務的預期基於知識過去的作業。

不幸的是,盡管核心作用、報告的方法通常用於分配參與者的幹預措施也不夠。例如,5%的206份報告描述的應該在婦產科期刊上相關的研究,並不是真正的隨機。23這估計是保守的,因為目前大多數報告不提供足夠的信息分配的方法。20.2330.31日3233

相關的改善報告:配偶聲明

DerSimonian和他的同事們指出,“編輯器可以大大提高臨床試驗的報告,為作者提供的項目列表,他們將嚴格報道。”34在1990年代早期,期刊編輯的兩組實驗,試驗報告的獨立方法學家發表建議。3536在隨後的社論,蘭尼敦促兩組,以滿足和發展一套共同的建議37;結果是CONSORT聲明(合並報告試驗標準)。38

CONSORT聲明(或配偶)包括一個清單的基本項應該包含在相關的報告和圖表記錄參與者的流動通過審判。它是主要針對報告相關的兩個集團的並行設計。大多數配偶也相關的一類更廣泛的試驗設計,如non-inferiority等價,階乘,集群,交叉試驗。對配偶的擴展清單報告試驗與這些設計已經出版,394041作為報告某些類型的數據(有那些危害42),類型的幹預(後備治療43、中藥幹預44)和抽象。45

配偶的目的是提供指導,作者對如何改善他們的試驗報告。試驗報告需要清晰、完整的、透明的。同行評議者,讀者和編輯也可以用配偶幫助他們批判性的評價和解釋相關的報告。然而,配偶不是作為質量評估工具。相反,配偶的內容集中在項目內部和外部的相關試驗的有效性。很多項目沒有明確配偶也應該包含在一份報告中提到,如一個倫理委員會批準的信息,從參與者,獲得知情同意,相關,存在數據安全監督委員會。此外,提到的任何其他方麵的審判應該適當的報道,比如信息相關的成本效益分析。464748

自1996年出版以來,配偶支持超過400種期刊(www.consort-statement.org)和幾個編輯組織,如國際醫學期刊編輯委員會。49配偶的引入在期刊質量與改善相關的報告。175051然而,配偶是一個持續的計劃,和配偶聲明是定期修訂。3配偶9年前最後一次修訂,2001年。525354自那時以來,證據基礎告知配偶有了顯著的增長;經驗數據凸顯了新的憂慮關於相關的報告,如選擇性報告結果。555657因此配偶組會議召開2007年1月,在加拿大,2001年修改CONSORT聲明及其附帶的文檔的理解和闡述。修改後的清單如表1所示和流程圖,沒有修改,在圖1中525354

表1

配偶2010清單的信息包括當報道一個隨機試驗

把這個表:

2010年配偶聲明:解釋和細化

在2001年的配偶修訂,顯然,解釋和精化的CONSORT聲明背後的原則將有助於調查人員和其他人寫或評價試驗報告。配偶的解釋和精化58發表在2001年與2001年版的CONSORT聲明。它討論了每個項目的基本原理和科學背景和提供發表好報告的例子。修改那篇文章的基本原理是類似於修改語句,上麵所描述的。下麵我們簡要描述主要添加和刪除這個版本的解釋和闡述。

配偶2010解釋和精化:變化

我們取得了一些實質性的和一些表麵的改變這個版本的配偶說明文檔(全部細節突出顯示在2010年版本的CONSORT聲明59)。一些代表配偶清單的變化;有三個新的檢查表項的配偶2010 checklist-such 24項,要求作者報告他們的審判協議可以訪問。我們也更新了一些現有的解釋,包括最近的引用添加到方法論的證據,使用了一些更好的例子。我們已經刪除了術語表,現在可以在配偶網站(www.consort-statement.org)。在可能的情況下,我們描述的結果相關的實證研究。許多優秀的書籍的臨床試驗提供更全麵的方法論問題的討論。6061年62年最後,為了方便起見,我們有時指“治療”和“病人”,雖然我們認識到,並不是所有的幹預措施的評價相關的治療,並不是所有的參與者都是病人。

清單項目

標題和摘要

1項。識別一個隨機試驗的標題。

的例子,“吸煙減少口服尼古丁吸入器:雙盲,隨機臨床試驗的有效性和安全性。”63年

解釋,能夠識別一個隨機試驗的報告電子數據庫在很大程度上取決於索引。索引器可能不分類作為一個隨機試驗報告,如果報告沒有明確作者這個信息。64年確保適當的索引,容易識別,研究作者應該使用“隨機”這個詞在標題表明參與者被隨機分配到他們的對比組。

項目1 b。結構化的總結試驗設計、方法、結果和結論

具體指導看到配偶抽象。4565年

解釋,清澈,透明,足夠詳細摘要很重要,因為讀者經常基地評估這些信息。一些讀者使用抽象作為篩查工具決定是否閱讀全文。然而,並不是所有的試驗都是免費和一些衛生專業人員無法獲得完整的試驗報告、醫療決策有時是由隨機試驗的基礎上抽象的。66年

期刊文摘應包含足夠的信息試驗作為精確記錄的行為和結果,提供最優的信息中的試驗空間約束和日記的格式。寫文摘幫助個人正確地構造和快速評估結果的相關性和艾滋病相關報告的檢索電子數據庫。67年抽象應該準確地反映包括在完整的期刊文章和不應該包括信息沒有出現在論文的主體。研究比較信息的準確性在文摘》雜誌上報道,報道的文本完整出版發現聲稱不一致,或失蹤,全文的主體。68年69年70年71年相反,從抽象可以省略重要危害嚴重的誤導別人的解釋試驗結果。4272年

最近擴展CONSORT聲明提供了一個基本項目列表,作者應該包括當報道一個隨機試驗的主要結果日誌(或會議)文摘(見表2)。45我們強烈建議使用結構化的抽象隨機試驗報告。他們為讀者提供試驗一係列標題下的信息有關的設計、行為,分析和解釋。73年一些研究發現,結構化的抽象的更高質量比傳統的描述性的抽象74年75年,他們能讓讀者更容易地找到信息。76年我們認識到,許多期刊已經開發出自己的結構和詞限製報告摘要。這不是我們的意圖提出這些格式的修改,但是推薦哪些信息應該報道。

表2

項目包括在報告一個隨機試驗的文摘》雜誌上

把這個表:

介紹

項目2。科學背景和基本原理的解釋

的例子,“手術是首選的治療患者的疾病階段I和II非小細胞肺癌(NSCLC)…一個NSCLC薈萃分析的結果結合八個隨機試驗的手術和手術+輔助cisplatin-based化療和顯示一個小,但並不顯著(p = 0.08),約5%的絕對生存利益在5年(從50%到55%)。當時當前試驗設計(1990年代中期),輔助化療沒有成為標準的臨床實踐…新輔助化療的臨床理由三:回歸的主要癌症可以實現從而促進和簡化或減少後續手術;未被發現的微轉移可能處理的治療;和假定的刺激可能會有抑製殘餘癌細胞生長因子釋放的手術和後續的傷口愈合…當前審判是因此設置比較,患者可切除的非小細胞肺癌患者,手術僅與三個周期以鉑為基礎的化療之後,手術的整體生存、生活質量,病理分期,resectability率,手術範圍,時間和複發的網站。”77年

解釋,通常,自由流動的介紹包括文本、作者的解釋他們的審判的科學背景和原理,和它的大綱。這也可能是適當的,包括試驗的目標(見項目2 b)。可能解釋的基本原理(例如,評估可能的藥物對腎髒功能的影響)或務實的(例如,指導實踐通過比較兩種療法的好處和壞處)。作者應該報告任何積極的幹預措施的好處和危害的證據包括在試驗和應該為幹預措施如何建議一個合理的解釋工作,如果這是不明顯的。78年

赫爾辛基宣言指出,生物醫學研究涉及人們應該建立在一個已經具有廣泛知識的科學文獻。79年也就是說,它是不道德的揭露人類不必要的風險研究。一些臨床試驗已被證明是不必要的,因為他們解決的問題已經或可能已經回答了現有文獻的係統回顧。80年81年因此,需要引入新的試驗應該是合理的。理想情況下,它應該包括一個參考係統回顧之前的類似試驗報告或缺乏這樣的試驗。82年

項目2 b。特定的目標或假設

的例子,“在當前的研究中,我們測試的假設主動管理的政策未生育過的工黨將:1。降低剖腹產率,2。減少長時間的勞動;3所示。不影響產婦出生滿意體驗。”83年

解釋,目標是試驗設計的問題的答案。他們通常與特定的治療或預防幹預的療效。假設是預先確定的問題被測試來幫助實現目標。比目標更具體的假設並服從明確統計評估。在實踐中,目標和假設並不總是很容易區分。大多數的報道相關試驗提供足夠的信息目標和假設。84年

方法

3項。試驗設計的描述(如並行,階乘)包括分配比例

的例子,“這是一個多中心、分層(6到11年和12到17歲,與不平衡隨機[2:1]),雙盲,安慰劑對照,與這些相應平行的組織在美國進行的研究(41網站)”。85年

解釋,“設計”一詞通常是指審判是如何設置的所有方麵,但它也有一個窄的解釋。許多更廣泛的試驗設計的特定方麵,包括隨機和致盲的細節,解決配偶其他地方的清單。我們尋求的信息類型的試驗,如平行組或階乘,和概念框架,如優勢或non-inferiority和其他相關問題沒有解決其他地方的清單。

單獨的CONSORT聲明主要關注試驗參與者隨機兩個“平行”組。事實上,幾乎超過一半的試驗發表這樣的設計。16主要的替代設計多臂機平行,交叉,集群,40和階乘設計。同時,大多數試驗將確定一個新的幹預的優越性,如果它存在,但其他人則用來評估non-inferiority或等價。39顯然是很重要的,研究人員描述了這些方麵的試驗,包括隨機的單位(如病人,醫生實踐,病變)。理想也包含這些細節抽象(見項目1 b)。

如果一個不太常見的設計工作,鼓勵作者解釋他們的選擇,特別是在這種設計可能意味著需要更大樣本大小或更複雜的分析和解釋。

盡管大多數試驗使用相等的隨機兩組(比如1:1),它有助於提供顯式分配比例。藥物試驗,試驗(I-IV)的指定階段也可能是相關的。

項目3 b。重要的變化方法試驗開始後(如合格標準),與原因

的例子,“病人被隨機分配到六個平行組之一,最初1:1:1:1:1:1率,獲得的五otamixaban…方案…或依諾肝素的主動控製…一個獨立數據監測委員會審查選取患者安全的數據;沒有臨時分析功效和徒勞。在審判期間,這個委員會建議接受的最低劑量otamixaban (0·035 mg / kg / h)停止因為抗凝不足的臨床證據。協議立即依法修改建議,並隨後參與者被隨機分配在2:2:2:2:1比其餘otamixaban和對照組,分別。”86年

解釋,幾個試驗可能會沒有任何固定的計劃(即完全探索),但大多會有一個協議,指定詳細的審判將如何進行。可能會有偏離原來的協議,因為它是無法預測每一個可能的審判過程中變化情況。一些試驗因此會有重要的變化在試驗開始後的方法。

變化可能是由於外部信息可以從其他研究,或內部財務困難,可能是由於一個令人失望的招聘率。這種協議的變化應在不破壞的致盲積累數據對參與者的結果。在一些試驗中,一個獨立的數據監測委員會將作為其職責的一部分的可能性,建議協議基於看到選取數據變化。這樣的變化可能會影響研究方法(如更改治療方案,合格標準,隨機比例,或隨訪時間)或審判行為(比如刪除中心數據質量較差)。87年

一些試驗是建立一個正式的“自適應”的設計。這些設計沒有公認的定義,但工作定義可能是“一個多級的研究設計,使用積累的數據來決定如何修改方麵的研究沒有破壞的有效性和完整性試驗。”88年通常的修改樣本大小和治療武器的數量和可能導致決策變得更迅速和更有效的利用資源。然而,重要的倫理、統計和實際問題在考慮這樣一個設計。89年90年

修改是否明確試驗設計的一部分,或者為了應對不斷變化的環境,至關重要的是,他們完全有報道對幫助讀者解釋結果。改變從協議目前不報道。回顧與協議顯示,大約有一半的期刊文章描述相關的有一個無法解釋的差異的主要結果。57頻繁的無法解釋的差異也被觀察到隨機的細節,致盲,91年和統計分析。92年

4項。合格標準為參與者

的例子,“合格的參與者都是18歲或以上的成人與艾滋病毒達到了合格標準為根據馬拉維國家艾滋病抗逆轉錄病毒療法治療指南(臨床階段III或IV或任何階段與CD4細胞計數< 250 /毫米3)和體重指數為< 18.5開始治療。排除標準是懷孕和哺乳期或參與另一個補充喂養計劃。”93年

解釋,合格標準的一個全麵的描述用於選擇所需的試驗參與者是幫助讀者解讀這項研究。特別是,清楚地了解這些標準的要求來判斷誰是為數不多的幾個元素應用的實驗結果是,審判的generalisability(適用性)和相關臨床和公共衛生實踐(參見項目21)。94年招聘方法的描述,如轉介或自我選擇(例如,通過廣告),在這種情況下也很重要。因為他們是應用隨機之前,合格標準不影響實驗的內部效度,但其外部效度的核心內容。

典型的和被廣泛接受的選擇標準與疾病的性質和階段研究,排除的人被認為是特別容易受到傷害的幹預研究,研究和問題需要確保滿足法律和道德規範。知情同意通過研究參與者,例如,通常需要在幹預研究。常見的納入和排除標準之間的區別是不必要的;相同的標準措辭參與者包括或排除。95年

盡管其重要性,合格標準往往不充分報道。例如,試驗導致臨床警報發布的八個國家衛生研究院指定平均31合格標準的協議,但隻有63%的期刊文章中提到的標準,隻有19%的人提到的臨床警報。96年類似的缺陷被發現艾滋病毒的臨床試驗。97年在364年手術相關的報道中,25%沒有指定任何合格標準。98年

項目4 b。設置和位置數據收集

的例子,“研究發生在抗逆轉錄病毒治療診所的伊麗莎白女王中心醫院在布蘭太爾,馬拉維,從2006年1月到2007年4月。馬拉維布蘭太爾的主要商業城市人口的1 000 000,估計2004年成人艾滋病毒流行率為27%。”93年

解釋,隨著參與者的資格標準(見4項)和幹預措施的描述(見第五項),設置和位置信息是至關重要的的適用性和generalisability法官審判。參與者招募從小學,中學,還是三級醫療保健和社區的?醫療機構有很大區別在他們的組織、經驗和資源的基線風險條件下調查。其他方麵的設置(包括社會、經濟和文化環境和氣候)也會影響研究的外部效度。

作者應該報告的數量和類型設置和描述所涉及的保健提供者。他們應該報告的位置進行了研究,包括國家、城市如果適用,周圍環境(例如,社區,辦公室練習,醫院診所,或住院單位)。特別是,它應該清楚試驗進行了在一個或幾個中心(“多中心臨床試驗中”)。這個描述應該提供足夠的信息,以便讀者可以判斷試驗的結果可能會與自己的設置。審判進行可能不同的環境相當的環境試驗的結果後,用於指導實踐和政策。94年99年作者也應報告任何其他設置和位置信息,可能會影響觀察結果,如交通問題,可能影響患者參與或延遲管理幹預措施。

第五項。每個組的幹預措施有足夠的細節來允許複製,包括當他們是如何管理的

的例子,“鎮靜的患者都接受了第一劑量研究的藥物(如口服延長釋放美托洛爾匹配100毫克或安慰劑)術前2 - 4 h。研究藥物管理局要求50 bpm或者更多的心率和收縮壓100毫米汞柱或更高;這些血液動力學之前檢查每個管理。在任何時候,如果在第一次手術後6 h,心率是80 bpm和收縮壓100毫米汞柱或更高,患者接受他們的第一個術後劑量(延長釋放美托洛爾100毫克或安慰劑)匹配口服藥。如果研究藥物並不是在第一次6 h,患者接受他們的第一個術後劑量在手術後6 h。第一次術後12 h後劑量,患者開始服用口服延長釋放美托洛爾每天200毫克或安慰劑30天。如果一個病人的心率一直低於45 bpm或者他們的收縮壓低於100毫米汞柱,研究藥物保留直到他們的心率和收縮壓恢複;研究藥物然後重啟在100毫克每日一次。患者心率一直45-49 bpm和收縮壓超過100毫米汞柱推遲12小時服用研究藥物。”One hundred.

“病人被隨機分配接受定製的氯丁橡膠夾板晚上穿或常規治療。夾板是剛性其他矯正法推薦隻在夜間使用。它覆蓋的拇指和魚際隆起而不是手腕(圖1)。夾板是由3個訓練有素的職業治療師,調整夾板的每個病人,這樣第一個網頁可以打開了,拇指放在第一長手指的反對。鼓勵病人接觸職業治療師如果他們覺得夾板需要調整,疼痛增加戴夾板時,或有不利影響(如皮膚流失)。因為沒有治療可以被認為是黃金標準在這種情況下,控製和幹預組患者在接受常規護理的自由裁量權醫師(全科醫生或風濕病學家)。我們決定不使用安慰劑,因為據我們所知,沒有安慰劑夾板療法取得了成功的致盲的患者,推薦。”101年

解釋,作者應該徹底描述每個幹預,包括控製幹預措施。描述應該允許臨床醫生想要知道如何使用幹預管理的幹預試驗評估。102年藥物幹預,信息將包括藥物名稱、劑量,管理方法(如口服、靜脈注射),時間和持續時間的管理、條件幹預保留,滴定方案如果適用。如果對照組接受常規治療”是很重要的描述完全構成。如果對照組和幹預組接受幹預的結合作者應該提供一個全麵的描述每個幹預的解釋順序介紹了幹預措施的組合或撤回,如果適用和觸發器的介紹。

的特定擴展CONSORT聲明解決非藥理和中藥幹預措施的報告和他們的特定的報告要求(如技術、細節的幹預是標準化)。4344我們建議讀者谘詢的語句也采用非藥物治療和中藥幹預。

6項。完全定義預先確定主要和次要結果措施,包括如何以及何時他們評估

的例子,”功效的主要終點對牛皮癬患者的比例達到75%改善牛皮癬活動從基線到12周的帕斯(銀屑病麵積和嚴重程度指數)額外的分析都是在帕斯分數和百分比變化改善目標牛皮癬病變。”103年

解釋,所有相關的評估響應變量,或結果(終點)的組進行比較。大多數試驗都有幾個結果,其中一些是比其他人更感興趣。主要結果測量是預先確定的結果認為是最重要的利益相關方(這樣一個病人,決策者、臨床醫生、資助者)和通常使用的樣本量計算(見項目7)。一些試驗中可能有一個以上的主要結果。有幾個主要的結果,然而,帶來的問題解釋與多樣性的分析(見項目18 - 20),不建議使用。主要的結果應該是明確表示在一個隨機對照試驗的報告。其他感興趣的結果是次要的結果(額外的結果)。可能有幾次要結果,通常包括意外的或意想不到的影響的幹預(見19項),盡管傷害應該被視為重要的是否標明主要或次要的。

所有結果的措施,主要或次要,是否應該被完全識別和定義。這裏的原則是提供的信息應足以允許其他人使用相同的結果。102年當評估結果在幾個時間點隨機後,作者也應該顯示的預先確定的時間點主要興趣。對於許多後備幹預指定誰評估結果是有幫助的(例如,如果需要特殊技能)和評估有多少。43

可用的和適當的,之前開發和驗證量表的使用或共識指南應該報道,104年105年提高質量的測量和協助相比,類似的研究。106年例如,評估生活質量可能會提高使用儀器進行驗證。107年作者應該表明量表的出處和屬性。

超過70的結果是196年相關的非甾體抗炎藥用於風濕性關節炎,108年和640種不同的工具被使用在精神分裂症2000次試驗,其中369隻被使用一次。33調查149年2000次試驗表明,未發表的尺度是偏見的根源。後備試驗中,三分之一的治療優勢基於出版尺度不了如果發布範圍內使用。109年類似的數據報告。110年111年519年隻有45%的一群相關的出版於2000年指定的主要結果16;相比之下,有53%的614年類似的隊列相關的出版於2006年。17

項目6 b。任何更改試驗開始後,試驗結果與原因

的例子,“最初的主要終點是全因死亡率,但是,在蒙麵分析,數據和安全監測委員會指出,總體死亡率低於預期,這項研究不能與樣本容量和功率原計劃完成。指導委員會因此決定采用co-primary端點的全因死亡率(原主要終點),與全因死亡率或心血管住院(第一個指定二級端點)。”112年

解釋,有許多原因偏離最初的研究協議(見24項)。作者應該報告所有主要修改協議,包括計劃外更改合格標準、幹預,考試,數據收集、方法的分析和結果。這些信息並不總是報道。

如前所示(見6項),大多數試驗記錄多個結果,結果將報告的風險選擇的子集(見17項)。Pre-specification和報告的主要和次要結果(見6項)應該消除這種風險。然而,在一些試驗中,環境需要一個評估方式的改變的結果,甚至,在上麵的示例中,切換到一個不同的結果。例如,可能有外部的證據來自其他試驗或係統的評論暗示終點可能不合適,或招聘或整個事件率試驗中可能低於預期。112年改變終點基於選取的數據更有問題的,雖然可能指定的上下文自適應試驗設計。88年作者應該識別和解釋任何這種變化。同樣,試驗開始後任何更改名稱的結果作為主要或次要應該報道和解釋道。

比較102年協議和出版物的隨機試驗發現,62%的試驗報告至少有一個主要的結果是改變,介紹,或者省略與協議。55主要結果之間不同協議和出版物的40%一群48試驗由加拿大衛生研究院資助的研究。113年沒有一個後續150試驗的報告提到,更不用說解釋說,變更協議。類似的結果與其他研究已經報道最近在實證研究結果的係統回顧報告的偏見。57

項目7個。樣本大小是如何決定的

的例子,“檢測減少小靈通(術後住院)的3天5天(SD),在協議Lobo等的研究17雙麵的5%顯著性水平和80%的力量,每組50例的樣本大小是必要的,給定一個預期的輟學率為10%。招聘這個包含12個月期的患者數量的預期。”114年

“基於預期的11%的主要複合終點的發生率在安慰劑組2.25年,我們計算出我們需要950主要終點事件和樣本量9650例患者給予90%功率檢測ivabradine和安慰劑之間的顯著差異,相應減少了19%的相對風險(雙麵1型誤差的5%)。我們最初設計的事件驅動的審判,並計劃950年主要終點事件發生時停止。然而,主要終點的發病率高於預測,也許是因為招募患者基線特征,人比預期更高的風險(例如,低比例的NYHA類我和較高的糖尿病和高血壓)。我們計算,當950年主要終點事件發生,最近包括病人隻會治療了3個月。因此,在2007年1月,執行委員會決定改變被驅動到一個完全時間驅動,項目研究和繼續研究,直到病人隨機被隨訪12個月。這種變化並沒有改變計劃3年時間學習。”115年

解釋,科學和道德的原因,試驗的樣本量需要仔細計劃,與醫學之間的平衡和統計方麵的考慮。理想情況下,一項研究應該足夠大,有一個高概率(權力)的檢測是一個給定的顯著臨床重要差異大小如果這樣的差異存在。的規模效應被認為重要的是逆相關所需的樣本量檢測;也就是說,大樣本檢測微小的差異是必要的。元素的樣本量計算每組(1)估計的結果(這意味著臨床重要目標區別幹預組);(2)α(I型)誤差水平;(3)統計力量(或β(II型)錯誤級別);和(4),連續的結果,測量的標準偏差。116年這些元素的相互作用,他們的報告將為集群不同試驗40和non-inferiority等效試驗。39

作者應該表明樣本大小是如何決定的。如果一個正式的權力使用計算,作者應該確定計算的主要結果(見6項)為依據,所有使用的數量計算,結果每個學習小組目標樣本大小。最好報價預期的結果在對照組和群體之間的差異不願意忽視。或者,作者可以呈現比例的事件或意味著每個小組在他們的計算中使用。細節應給予任何津貼為摩擦或不符合在研究過程中。

一些方法學家寫的,所謂的動力不足的試驗可能是可接受的,因為他們最終會在係統回顧和薈萃分析相結合,117年118年119年因為一些信息也比沒有信息。值得注意的是,重要事項應用這樣的審判應該公正,報道,並發表無論結果,從而成為可供薈萃分析。118年另一方麵,許多醫學研究人員擔心動力不足的試驗與不確定的結果仍未公布堅稱,所有試驗應分別有“足夠的權力。“這場爭論還會繼續,和配偶小組的成員有不同的觀點。然而,極度辯論和那些觀點是無形的試驗報告。無論審判的力量,作者需要正確地報告他們的預期大小與所有方法和假設。118年透明地揭示了權力審判的讀者,給了他們一個尺度試驗評估是否達到其計劃規模。

在一些試驗中,臨時分析用於早期幫助決定是否停止或繼續招聘有時超出了計劃試驗結束(見項目7 b)。如果實際樣本大小不同於原先預定的樣本量為其他原因(例如,因為可憐的招聘或修訂目標樣本大小),應給予解釋。

與小樣本的研究報告通常包括錯誤的結論,幹預組沒有差異,而事實上很少有患者研究作出這樣的聲明。120年一直評論發表的試驗發現,高比例的試驗低功率檢測臨床有意義的治療效果。121年122年123年在現實中,雖小但臨床上有意義的真正差異更有可能比大差異存在,但需要大型試驗檢測。124年

一般來說,在試驗報告的樣本大小看起來小。樣本量中值為54關節炎患者在196年試驗,108年46皮膚病患者在73年試驗,8和2000年65例試驗在精神分裂症。33這些小樣本大小是一致的與519年一項研究試驗2000年12月在PubMed索引16和類似的試驗(n = 616)於2006年在PubMed索引,17招募的患者數量,中位數為平行組試驗是80年跨年。此外,許多評論發現,一些作者報告如何確定樣本容量。8143233123年

沒有績效的事後計算統計權力使用的實驗結果;然後適當的權力由置信區間表示(見17項)。125年

項目7 b。當適用時,解釋任何臨時的分析和停止準則

的例子,“兩個臨時分析試驗過程中。意義的水平保持一個整體P值為0.05,根據O 'Brien-Fleming停止計算邊界。最後分析使用Z分數1.985有一個關聯的P值為0.0471。”126年

“一個獨立的數據和安全監測委員會定期回顧了有效性和安全性數據。Haybittle-Peto邊界停止規則是基於修改4 SD上半年下半年研究和3 SD效果數據,研究和3 SD上半年和下半年2 SD安全數據。兩個正式的臨時的功效進行分析時主要事件的預期數量的50%和75%應計;沒有修正的報告P值執行這些臨時測試。”127年

解釋,許多試驗長期招募參與者。如果一個幹預工作特別好或不好,這項研究可能需要結束早期出於倫理方麵的原因。這個問題可以被解決通過檢查結果的數據積累,最好是由一個獨立的數據監測委員會。然而,執行多個統計考試積累數據沒有適當的修正可能導致錯誤的結果和解釋。128年如果積累試驗數據檢查五臨時使用P值為0.05的分析,整個假陽性率接近19%比5%的名義。

幾組順序統計方法可以調整多個分析,129年130年131年和他們的使用試驗中應預先確定協議。用這些方法,在每個臨時數據比較分析,P值小於臨界值集團指定的順序法顯示統計學意義。一些實驗使用組順序決策方法作為一個援助,132年而其他人把他們當作一個正式的停止規則(與審判的意圖將停止如果觀察到的P值小於臨界值)。

作者應該報告或數據監測委員會是否服用了多個“看起來”數據,如果是這樣,有多少是什麼引發了它們,使用的統計方法(包括任何正式停止規則),和他們是否計劃在審判開始前,在數據監測委員會看到任何臨時數據分配,或者一段時間之後。這些信息通常是不包含在已發表的試驗報告,133年試驗報告中甚至比原計劃提前停止。134年

8項。方法用於生成隨機分配序列

的例子,“獨立藥劑師分發活躍或安慰劑吸入器根據計算機生成隨機名單。”63年

”分配的參與者,使用計算機生成的隨機數字列表”。135年

解釋,試驗中參與者應該分配給比較組的基礎上一個機會(隨機)過程的特點是不可預測性(見框1)。作者應該提供足夠的信息,讀者可以評估方法用於生成隨機分配序列和偏見在任務組的可能性。隨機過程是很重要的信息包含在主要文章的主體,而不是作為一個單獨的補充文件;會被讀者所忽略。

“隨機”一詞有精確的技術含義。用隨機分配,每個參與者都有一個已知的概率接受每個幹預前一個分配,但分配的幹預是由過程和無法預測的機會。然而,“隨機”經常使用不當在文獻中描述的非隨機試驗,確定的分配方法被使用,如交替,醫院數字,或出生日期。當調查人員使用這樣的非隨機方法,他們應該描述精確,不應使用術語“隨機”或任何變化。甚至連“擬隨機”一詞描述這些試驗是不可接受的。基於隨機試驗方法通常產生偏見的結果。234136年偏見可能源自無法掩蓋這些分配係統充分(見9項)。

許多序列生成適當的方法。然而,讀者無法判斷充分性等方麵“隨機分配”,“隨機”或“隨機”沒有進一步細化。作者應該指定序列生成的方法,如隨機數字表或一個計算機化的隨機數生成器。生成的序列可能最小化的過程,但一般人都可接受的非隨機的方法(見附表2)。

框2:隨機和最小化

  • 簡單的隨機,基於單一純隨機分配比率被稱為簡單隨機。簡單用1:1隨機分配比例是類似於拋硬幣,雖然我們不提倡拋硬幣的隨機一個隨機對照試驗。“簡單”是有點用詞不當。雖然其他隨機計劃聽起來複雜和更複雜的,在現實中,簡單的隨機複雜優雅,更不可預測和預防超過偏差水平的其他選擇。

  • 受限製的隨機-任何隨機的方法,不是簡單的隨機。被隨機是最常見的形式。限製隨機的其他方法包括更換,有偏見的硬幣,和urn隨機,盡管這些都是使用次數少得多了。141年

  • 被隨機-阻塞將生成用於確保比較組根據預定的比率,通常是1:1或組大約相同的大小。阻塞可以用來確保關閉每組的數量平衡在審判期間的任何時候。每一塊八個參與者,例如,四是分配給每個部門的審判。142年改善平衡付出的成本減少序列的不可預測性。盡管不同幹預措施的順序隨機在每個塊中,一個人跑下一個治療的試驗可以推斷出一些分配如果他或她知道塊大小。143年致盲的幹預措施,使用較大的塊大小,隨機不同的塊大小可以改善這個問題。

  • 分層隨機-分層是用來確保良好平衡的參與者在每組特征。偶然的機會,尤其是在小型試驗,學習小組為基線特征可能沒有很好地匹配,如年齡和階段的疾病。這削弱了試驗的可信度。144年這樣的失衡可以避免在不犧牲隨機的優點。分層確保參與者的數量接收每個幹預密切平衡在每個層。分層隨機是通過執行一個單獨的兩個或兩個以上的隨機過程在每個參與者的子集(例如,這些定義每個研究中心,年齡,或疾病嚴重程度)。分層的中心在多中心臨床試驗中很常見。分層需要某種形式的限製(如屏蔽層內)。分層沒有阻塞是無效的。

  • 最小化,最小化確保幹預組數之間的平衡選擇病人因素(如年齡)。2260第一個病人是真正隨機分配;對於每一個後續的參與者,最小化的治療分配不平衡之間的選擇的因素組標識。分配可以被使用,或者可以選擇隨機加權沉重地支持的幹預減少不平衡(例如,一個概率為0.8)。使用一個隨機組件通常是可取的。最小化的優勢使小組密切相似的參與者在試驗的所有階段特征。隨機最小化提供唯一可以接受的替代,一些人認為它是優越的。145年另一方麵,最小化缺乏理論依據消除偏見在所有已知的和未知的因素。然而,一般來說,使用最小化的試驗被認為是方法論上相當於隨機試驗,即使一個隨機元素沒有注冊。

在一些試驗中,參與者是故意不平等的數字中分配的幹預:例如,能獲得更多的經驗與一個新過程或限製試驗的成本。在這種情況下,作者應隨機率報告(例如,2:1或兩個治療參與者每控製參與者)(見3項)。

代表性的PubMed索引試驗在2000年,隻有21%的人報告一個適當的隨機序列生成方法16;這個增加到34%相似的PubMed索引試驗是在2006年。17在90%以上的這些情況下,研究人員使用一個隨機數發生器在計算機或一個隨機數字表。

項目8 b。類型的隨機;任何限製的細節(如阻塞和塊大小)

的例子,“隨機序列創建使用占據9.0 (StataCorp、大學城、TX)統計軟件,由中心分層1:1分配使用隨機塊大小的2,4,6。”137年

“參與者被隨機分配後簡單隨機化程序(計算機隨機數)1 2治療組。”138年

解釋,在數百名參與者或更簡單的隨機試驗通常可以被信任來生成兩個審判組織類似的數字139年和生成組大致相似的已知和未知預後變量。140年小型試驗(見7項)——即使對於試驗不是為了很小,因為它們可能停止在達到他們的目標size-some之前限製隨機(程序來幫助實現組織大小或特征)之間的平衡可能是有用的(見附表2)。

重要的是表明是否沒有使用限製,這樣的陳述或說明“簡單隨機”。否則,用於限製隨機的方法,以及使用的方法隨機選擇,應該指定。為阻止隨機,作者應提供細節塊是如何生成的(例如,通過使用交換塊設計與計算機隨機數生成器),塊大小或尺寸,塊大小是否固定或隨機變化。如果實驗開始意識到的塊大小(s),這些信息也應報告為這些知識可能導致代碼打破。作者應該指定是否分層使用,如果是,涉及哪些因素(如招聘網站、性別、疾病階段),在地層分類截止值,用於限製和方法。雖然分層是一個有用的技術,特別是對於小型試驗,實現起來比較複雜,如果使用了許多作為分層因素可能是不可能的。如果最小化(見附表2),它應該明確標識,作為應變量納入計劃。如果使用一個隨機元素應該表示。

206年隻有9%的試驗在專業期刊上的報告23和39%的80次試驗一般醫學期刊報道使用分層。32在每種情況下,隻有約一半的報告提到的使用限製隨機。然而,這些研究和Adetugbo和威廉姆斯8發現治療組的大小在許多試驗是相同或非常相似,但阻止或分層並沒有提到。接近平衡的一個可能的解釋數字漏報的使用限製隨機。

項目9。機製用於實現隨機分配序列(如按順序編號的容器),描述所采取的任何步驟隱藏序列直到幹預

的例子,“強力黴素和安慰劑膠囊和相同的外觀。他們事先包裝瓶和每個女人根據隨機編號計劃。每個女人都被分配一個訂單號和接收相應的預填充的膠囊瓶。”146年

“分配序列是隱蔽的研究員(小)登記和評估參與者按順序編號,不透明,密封和釘信封。鋁箔在信封是用來渲染信封不透水強烈的光。為了防止分配序列的顛覆,參與者的姓名和出生日期寫在信封和錄像的密封信封與參與者的細節可見。碳紙信封內信息的傳遞到內部的分配卡信封和第二個研究員(CC)後觀看錄像帶,以確保信封仍然密封在參與者的名字寫在他們。相應的信封打開後才登記的參與者完成所有基線評估和是時間分配的幹預。”147年

解釋,8項討論一代不可預知的任務序列。相當重要的是這個序列是如何應用當參與者加入到試驗(見框1)。生成的分配安排應該實現通過使用分配隱藏,23治療的關鍵機製,防止預知任務,從而保護那些招收參與者受到這方麵的知識。決定接受或拒絕一個參與者應該,應該從參與者獲得知情同意,在無知的序列中的下一個任務。148年

分配隱藏不應混淆致盲(見11項)。分配隱藏旨在防止選擇性偏差,保護作業序列直到分配,和總是可以成功地實現。2相比之下,眩目的旨在防止性能和確定偏差,保護分配後的序列,而不能總是執行。23沒有足夠的分配隱藏,然而,即使是隨機的,不可預測的任務序列可以被顛覆。2149年

集中或“第三方”的任務尤其可取的。許多好的分配隱藏機製整合外部介入。使用藥店或中央電話隨機係統兩種常用技術。自動分配係統可能會變得更加常見。150年當外部介入不可行,分配隱藏的極好方法是使用容器編號。幹預措施(通常是藥物)密封在根據分配序列順序編號相同的容器。151年封閉作業按順序編號,不透明,密封的信封是一個很好的分配隱藏機製如果努力開發和監控。這個方法可以破壞,然而,特別是如果它執行得很糟糕。調查人員時應確保信封是不透明的光,打開順序,隻有在參與者的名字和其他細節寫在適當的信封。143年

許多方法論的研究提供實證證據支持這些措施。152年153年試驗的分配順序已經不足或約定隱藏了更大的估計治療效果比試驗中,作者稱足夠分配隱藏。這些發現提供強有力的經驗證據,分配隱藏不足導致偏見在評估治療效果。

盡管分配隱藏機製的重要性,報道常常忽略這些細節。用於分配的幹預機製是省略了89%的類風濕關節炎試驗報告,108年試驗在婦產科期刊的48%,23一般醫學期刊和44%的試驗。32在一個更廣泛的代表性樣本的隨機試驗在PubMed索引,隻有18%的人報告任何分配隱藏機製,但是其中的一些報道機製是不夠的。16

10項。生成的序列分配,誰登記的參與者,參與者分配給幹預誰

的例子,“確定病人是否會被鏈黴素和躺(S)或單靠躺(C)是由引用統計係列基於隨機抽樣數量製定每個性由布拉德福德希爾教授在每個中心;係列的細節被未知的任何調查或協調員…接受病人的麵板後,在進入鏈黴素中心之前,適當的編號信封打開在中央辦公室;裏麵的卡片告訴如果病人是一個年代或C,然後這個信息是給中心的醫務官。”24

“分配組的詳細信息中包含有彩色卡片上按順序編號,不透明,密封的信封。這些都是準備在NPEU和保存在一個商定的位置在每個病房。隨機發生的第二階段的勞動力時,助產士認為陰道分娩即將來臨。進入一個女人走進書房,助產士打開下一個信封編號。”154年

“隨機塊是由計算機生成的隨機數字表由一名調查員沒有參與臨床試驗。我們通過入學的分層腫瘤相關的過程。在研究護士得到病人的同意,她打電話給一個聯係人是誰獨立招聘過程的分配貨物。”155年

解釋,正如9項提到的,隱蔽的分配幹預招生的時候尤其重要。因此,除了知道方法,同樣重要的是要理解隨機序列是如何來實施的,誰賺分配順序,誰登記的參與者,誰分配參與者審判組織。

隨機試驗參與者在試驗過程中有三個不同的步驟:序列生成、分配隱藏,和實現(見附表3)。雖然同樣的人可能執行多個進程在每個標題下,調查人員應該為之奮鬥的完全分離的人參與生成和分配隱藏從參與任務的實現。因此,如果有人參與序列生成或分配隱藏步驟,理想的情況是他們不應該參與實現的步驟。

盒3:在一個典型的隨機過程的步驟

序列生成
  • 生成一些隨機分配序列的過程

分配隱藏
  • 開發分配隱藏機製(如編號、相同的瓶子或按順序編號,密封,不透明信封)

  • 準備分配隱藏機製使用分配序列的生成步驟序列

實現
  • 報名參與者:

    • 評估資格

    • 討論了試驗

    • 獲得知情同意

    • 報名參與試驗

  • 確定幹預的任務(比如打開下一個信封)

  • 管理幹預

即使完美的序列生成和分配隱藏,未能獨立創建和分配序列的隱藏任務研究小組可能會引入偏見。例如,生成一個分配序列的人可以保留一個副本,谘詢的時候麵試潛在參與者的審判。因此,人可以偏見招生或作業過程中,無論任務序列的不可預知性。調查人員必須確保作業計劃是不可預測和鎖(例如一個保險箱在一棟建築,而無法進入到報名地點)甚至從生成它的人。報告的調查人員的審判應該指定存儲分配列表。

11項。如果做,蒙蔽後分配的幹預(例如,參與者,保健提供者,這些評估結果)和方式

的例子,“而分配給幹預組病人和醫生意識到手臂,分配結果評估和數據分析師一直蒙蔽分配。”156年

“致盲和平衡是嚴格維護通過強調飲食幹預工作人員和參與者,每個堅持健康的原則,並且每個某些專家所倡導的是優越的長期減肥。除了幹涉(營養師和行為心理學家),調查人員和員工都忽視飲食分配的參與者。審判堅持建立程序維護人員之間的分離,測量結果和員工提供幹預。員工獲得的測量結果並不明智的飲食集團的任務。幹預人員、營養師和行為心理學家發表的幹預並沒有把測量結果。所有人員,員工,和參與者一直蒙麵的測量結果和試驗結果。”157年

解釋,術語“致盲”或“掩蔽”是指隱瞞信息分配的幹預從參與審判的人可能受到這方麵的知識。致盲是一個重要的防止偏見,尤其是主觀評估的結果。153年

本傑明·富蘭克林被認為是第一個使用致盲的科學實驗。158年他被蒙上眼睛的參與者,所以他們不會知道,當他被運用催眠術(18世紀流行的“治療液”),這樣做表明催眠術是一個騙局。根據這個實驗,科學界認可致盲減少偏見的力量,它仍然是一個在科學實驗常用的策略。

框4,眩目的術語,定義了個人的組織(參與者,衛生保健提供者,數據收集器,結果退休審核人員,和數據分析師)誰都可能引入偏差試驗通過治療任務的知識。參與者可能有不同的反應,如果他們意識到自己的治療任務(如響應更積極接受治療時)。153年炫目的缺乏也會影響遵守幹預,使用co-interventions,退出試驗的風險。

選取醫療服務提供者可能會引入類似的偏見,選取數據收集器可能不同評估結果(如頻率或時間),重複測量的異常發現,在性能測試或提供鼓勵。選取結果退休審核人員可能不同主觀評估結果,選取數據分析師可能會引入偏見通過分析策略的選擇,比如選擇有利的時間點或結果,決定刪除患者從分析。這些偏見已經有據可查的。71年153年159年160年161年162年

致盲,與分配隱藏(見10項),可能並不總是適當的或可能的。一個例子是一個審判的疼痛程度比較與抽樣血液從ear或拇指。163年致盲當結果措施涉及一些主觀性尤為重要,如評估疼痛。炫目的數據收集器和結果退休審核人員不太可能對客觀結果,如因任何原因死亡。即便如此,然而,缺乏參與者或醫療服務提供者致盲會導致其它問題,比如微分磨損。164年在特定的試驗,尤其是手術試驗,炫目的參與者和外科醫生通常是困難的或不可能的,但炫目的數據收集器和結果退休審核人員往往是可以實現的。例如,病變可以拍攝之前和之後的治療和評估外部觀察者。165年無論致盲是可能的,作者可以和應該國家失明(參與者,衛生保健提供者,數據收集器,和結果退休審核人員)。

不幸的是,作者常常不報告是否使用致盲。166年例如,506年的報道,51%的試驗在囊性纖維化,167年33%的類風濕關節炎,196次試驗108年在皮膚科和38%的68次試驗8沒有狀態是否使用致盲。直到致盲試驗改善報告的作者,讀者將難以判斷的有效性試驗中,他們可能希望使用指導臨床實踐。

屏蔽這個詞有時用於偏好致盲,以避免混亂的醫療條件是沒有看到。然而,“致盲”似乎在其方法論意義上理解世界並為臨床試驗報告是可以接受的。165年168年

箱4:眩目的術語

為了讓一個技術術語工具必須有它的使用和解釋的一致性。作者的試驗通常使用術語“雙盲”,一般較少,術語“單盲”或“三重盲目。”A problem with this lexicon is that there is great variability in clinician interpretations and epidemiological textbook definitions of these terms.169年此外,200相關的報道,雙盲的研究發現18個不同組的組合其實蒙蔽了這些試驗的作者調查時,大約每五個實驗報道雙blind-did不是盲目的參與者,衛生保健提供者,或者數據收集器。170年

這項研究表明,條件是模糊的,因此,作者和編輯應該放棄使用。作者應該明確報告的致盲地位人士來說,眩目的可能影響試驗的有效性。

衛生保健提供者包括所有人員(例如,醫師、按摩師、物理治療師、護士)誰照顧參與者在試驗。數據收集器收集數據對審判結果的個體。結果退休審核人員確定參與者的個體體驗感興趣的結果。

一些研究者也提倡致盲和報告的眩目的狀態數據監測委員會和作家的手稿。160年這些團體並不常見致盲,炫目的價值爭論。171年

有時一群個體(如醫療服務提供者)同一個人完成另一個角色在試驗(如數據收集器)。即使是這種情況,作者應該明確國家這些團體的眩目的地位讓讀者判斷試驗的有效性。

項11 b。如果相關,描述相似的幹預措施

的例子,“傑米遜實驗室公司提供500毫克立即釋放煙酸在白色,長圓形,平分囊片。我們使用高效液相色譜法獨立消息來源的證實囊片內容…安慰劑是匹配研究藥物味道,顏色,大小,和包含微晶纖維素,二氧化矽,磷酸氫鈣,硬脂酸鎂,硬脂酸。”172年

解釋,就像我們尋找隱藏的證據向我們保證,任務是真正隨機的,我們尋求的證據致盲的方法。炫目的試驗參與者或衛生保健提供者,作者應該國家幹預的特點的相似性(如外觀、味道、氣味和方法管理)。35173年

有些人主張測試致盲通過要求參與者或衛生保健提供者的審判是否他們認為參與者收到實驗幹預或控製。174年因為參與者和衛生保健提供者通常會知道參與者經曆了主要結果,這使得很難確定他們的反應反映致盲的失敗或精確的假設幹預的療效。175年考慮到不確定性提供這種類型的信息,我們已經刪除了倡導報告這種類型的測試致盲的配偶2010聲明。然而,我們主張作者報告任何已知的妥協在致盲。例如,作者應該報告是否有必要截斷符號參與者在審判的行為在任何時候。

12項。統計方法用於比較組為主要和次要的結果

的例子,“主要終點是體重的變化在20周的研究意向處理人口…次要療效端點包括腰圍的變化,收縮壓和舒張壓,代謝綜合征患病率…我們使用協方差分析(ANCOVA)為主要終點和次要終點腰圍、血壓、patient-reported結果分數;這是輔以重複測量分析。ANCOVA模型包括治療、國家和性別作為固定效應,和體重隨機作為協變量。我們旨在評估數據是否提供的證據的優越性每個liraglutide劑量安慰劑(主要目標)和奧利司他(二級目標)”。176年

解釋,數據可以分析在很多方麵,其中一些可能不是嚴格意義上的適當的在一個特定的情況下。有必要指定哪個統計程序被用於每個分析,並進一步澄清的結果可能是必要的部分報告。遵循的原則是,“描述統計方法與足夠的細節,使一個知識淵博的讀者訪問原始數據來驗證報告的結果”(www.icmje.org)。同樣重要的是描述統計分析的細節如意向處理分析(見附表6)。

幾乎所有的方法分析產量估計治療效果,這是一個比較組之間的對比結果。作者應該陪這個置信區間估計的效果,這表明中央範圍的不確定性對於真正的治療效果。置信區間可能解釋為治療效果的範圍值與觀測數據兼容。是習慣目前的95%置信區間,使範圍將包括100年的真正價值在95年類似的研究。

研究結果也可以評估的統計學意義。P值代表了觀測數據的概率(或一個更極端的結果)可能會出現偶然當幹預沒有真正有所不同。實際P值(例如,P = 0.003)強烈的不精確的閾值報告,比如P < 0.05。48177年

標準分析方法假定數據是“獨立的。”For controlled trials, this usually means that there is one observation per participant. Treating multiple observations from one participant as independent data is a serious error; such data are produced when outcomes can be measured on different parts of the body, as in dentistry or rheumatology. Data analysis should be based on counting each participant once178年179年或者應該是通過使用更複雜的統計過程。180年錯誤分析的多個觀測每個是123年(63%)的196次試驗在類風濕性關節炎。108年

項目12 b。額外的分析方法,如子群分析和調整分析

的例子,“病人的比例反應比較治療組之間Mantel-Haenszelχ2測試,為分層變量調整後,甲氨蝶呤使用。”103年

“預先確定子群分析根據賦值(s)抗氧化治療,存在與否的心血管疾病之前,膳食攝入葉酸,吸煙,糖尿病,阿司匹林,激素療法,和維生素使用使用分層Cox比例風險模型進行。這些分析基線風險評估和使用受到限製參與者在基線常數子組數據。”181年

解釋,主要分析一樣,亞組分析的方法應明確指定。分析最強的是那些尋找證據的治療效果差異互補的子組(例如,年長和年輕的參與者),稱為交互測試比較。182年183年共同但誤導的方法是比較P值分別分析每組的治療效果。是錯誤的推斷子群的影響(交互)一個重要和非重要P值。184年這樣的推論有較高的假陽性率。

因為虛假的結果,風險高子群分析往往氣餒。14185年事後組比較(分析完成後查看數據)尤其不可能被進一步的研究證實。這種分析沒有偉大的可信度。

在一些研究中,調整失衡的參與者特征通過使用某種形式的多元回歸分析。雖然需要調整相關的流行病學研究要少得多,調整分析可能是明智的,特別是如果一個或多個變量被認為是預後。186年理想情況下,調整分析應該在研究方案中指定(參見24項)。例如,調整經常推薦給任何分層變量(見項目8 b)在分析戰略應遵循的原則設計。在相關的,決定調整不應由基線差異是否顯著(見16項)。183年187年任何調整的基本原理分析和應指定使用的統計方法。

作者應該明確的選擇變量調整後,指示如何處理連續變量,並指定分析是否計劃或建議的數據。188年評論發表的研究表明,調整分析報告是關於這些方麵的不足。188年189年190年191年

結果

13項。參與者流(圖是強烈推薦)

13項。為每個組,參與者被隨機分配的數量,收到預期的治療,主要結果進行了分析

的例子,參見無花果2和3

">Figure2

圖2流程圖的多中心試驗部分流動儲備與血管攝影指導經皮冠狀動脈介入(PCI)(改編自托尼諾et al313年)。圖中包括詳細信息排除參與者。

">圖3

圖3醫療管理流程圖的最小的手術而慢性gastro-oesophageal返流性疾病(改編自格蘭特et al196年)。圖中顯示了一個多中心試驗平行non-randomised偏好組。

解釋,的設計和開展一些相關的簡單,和參與者的流動,尤其是隨訪沒有損失或排除,通過每個階段的研究可以充分描述幾句話。在更複雜的研究,讀者可能難以辨別是否以及為什麼有些參與者分配沒有接受治療,失訪,或被排除在分析之外。51這些信息是至關重要的幾個理由。參與者被排除在外後分配不太可能代表所有參與這項研究。例如,患者不得用於後續評估,因為他們經曆了治療急性加重的疾病或傷害。22192年

摩擦損失的結果跟進,這通常是不可避免的,需要區別investigator-determined排斥等原因不合宜,退出治療,和窮人堅持試用協議。錯誤的結論可以達到如果參與者被排除在分析,群體之間的這種遺漏和失衡可能特別的偏見的說明。192年193年194年信息調查人員是否包含在所有參與者進行了隨機分析,在組織他們最初分配(意向處理分析(見16箱6)項),因此尤為重要。了解參與者的數量沒有收到分配的幹預或沒有完成治療允許讀者評估何種程度的估計療效治療可能低估了與理想條件下相比。

如果可用,評估資格的人數也應報告。雖然這個數字僅與外部效度相關,可以說是比另一個更重要,195年它是一個有用的指標,試驗參與者是否可能代表所有合格的參與者。

回顧相關的發表在領先五將軍和內科醫學期刊1998年發現報告的參與者往往是不完整的,特別是關於參與者收到的數量分配的幹預和失訪。51甚至信息作為基本的參與者的數量進行了隨機和沒有排除在分析數量多達20%的文章。51報告是更徹底的文章,包括圖流的參與者通過試驗,推薦了配偶。本研究通知修改流程圖的設計在修改後的CONSORT聲明。525354建議模板是圖1所示所需的數量,詳細描述在表3

表3

信息文檔流的參與者通過每個階段所需的隨機試驗

把這個表:

一些信息,比如個人評估資格的數量,可能並不總是知道,14根據試驗的性質,有些方麵可能會比其他人更相關。它有時會是有用的或必要的結構流程圖適應特定的試驗。在某些情況下,其他信息可能有效地補充道。例如,平行的流程圖組試驗的最小的手術相比,醫療管理慢性gastro-oesophageal回流還包括一個平行non-randomised偏好組(見圖3)。196年

的具體形式和內容流程圖可以根據不同的具體特性試驗。例如,許多試驗手術或疫苗接種不包括中斷的可能性。雖然配偶強烈建議使用這個圖形設備通信流在整個研究中,參與者沒有具體規定的格式。

項目13 b。為每個組,隨機損失和排除後,在一起的原因

的例子,“隻有一個協議偏差,研究小組在一個女人。她有一個異常骨盆測量和原定了選擇性剖腹產。然而,參加產科醫生判斷勞動力接受審判;剖腹產是在沒有完成第一階段的進展的勞動。”197年

“九個中心的監控導致戒斷,存在的一些病人不能證明,或其他嚴重違反良好的臨床實踐發生。”198年

解釋,一些協議偏差可能報道流程圖(見13項)——例如,參與者沒有收到預期的幹預。如果參與者排除後隨機(相反意向處理原則),因為他們被發現不符合資格標準(見16項),他們應該包含在流程圖中。使用術語“協議偏差”發表文章不足以證明隨機後排除的參與者。協議的性質後偏差和確切的原因不包括參與者隨機應該報道。

14項。日期定義招聘和後續的時期

的例子,“Age-eligible參與者招募了…1993年2月到1994年9月…參與者參加診所訪問時隨機(基線),每隔6個月3年。”199年

解釋,知道什麼時候發生,在一項研究期間受試者招募地方曆史背景的研究。醫療和手術治療,包括並發療法,不斷演進和可能影響日常保健給參與者在試驗。知道參與者招募的速度也可能是有用的,尤其是對其他調查人員。

後續的長度並不總是後定期隨機。在許多相關的事件的結果是時間,後續所有的參與者在一個特定的日期結束。這個日期應該,也是有用的報告最低,最大,平均隨訪時間。200年201年

回顧報告在腫瘤學期刊上,用生存分析,其中大多數是不相關的,201年132份報告發現,近80%(104)包括權責發生製的開始和結束日期的病人,但隻有24%的132份報告(32)也報道的日期跟蹤結束。

項目14 b。為什麼審判結束後還是停止

的例子,”時的臨時分析,總隨訪包括估計總數的63%的白細胞數量已經收集了在研究結束時,導致閾值為0.0095,是由Lan-DeMets alpha-spending函數法…臨時分析,RR 0.37在幹預組與對照組相比,p值為0.00073,低於閾值。數據和安全監測委員會建議研究者中斷試驗和提供包皮環切術,對照組,他們接著問來調查中心,MC割禮(醫療)建議和提議…因為這項研究是中斷,一些參與者沒有完整隨訪的日期,和他們尚未完成的訪問被描述為“計劃”在本文中。”202年

”2000年1月,疫苗供應問題需要全國臨時更換整個細胞組成部分結合DPT / Hib疫苗百日咳疫苗。這種疫苗概要文件有不同的局部不良反應,我們決定提前停止審判。”203年

解釋,可以說,實驗後臨時分析任意進行計劃外事件積累很少使用沒有統計準則運行風險高的數據在一個隨機的極端“捕捉”,這可能代表著一個龐大的高估的治療效益。204年

讀者可能會畫較弱的推論的審判截斷數據驅動的方式與一個報告其調查結果達到一個目標後獨立的結果。因此,相關的應該顯示為什麼審判結束(見附表5)。該報告還應披露外在因素影響的試驗決定停止試驗,並決定停止試驗,包括報告的作用資助機構在審議和決定停止試驗。134年

係統回顧143年相關停止比原計劃提前停止後發現,這些試驗報告說好處積累值66事件,估計平均相對風險為0.47事件的數量應計和強大的關係和作用的大小,用更少的事件產生較小的試驗最大的治療效果(優勢比31日95%置信區間12到82)。134年雖然越來越多的試驗發表在高影響醫學期刊報告提前停止,隻有0.1%的試驗報道停止早受益,與估計引起的仿真研究205年和調查的數據安全監督委員會。206年因此,許多試驗積累一些參與者和報告大治療效果可能比原計劃提前停止了這個動作,但未能報告。

箱5:早期停止

相關的可以結束時樣本量達到他們的目標,他們的事件計數目標,跟蹤目標的長度,或者當他們到達預定關閉日期。在這些情況下的審判將會停止的方式獨立於它的結果,和停止是不可能引入偏見的結果。另外,相關的可以比原計劃提前停止,因為臨時分析的結果顯示大於預期利益或損害實驗幹預。相關也可以比原計劃提前停止當調查人員發現的證據沒有重要區別實驗和控製幹預措施(即停止了徒勞)。此外,試驗可能停止早期因為審判變得不可行:資金消失,研究人員無法獲得符合條件的患者或研究幹預措施,或其他研究的結果使研究問題無關緊要。

完整的報告為什麼審判結束了對基於證據的決策很重要(參見條目14 b)。研究者檢查為什麼143次試驗停止早期發現許多未能受益報告關鍵方法學信息決定停止是如何達到樣本量(n = 28)計劃,臨時分析之後,這次審判是停止(n = 45),或者停止規則是否明智的決定(n = 48)。134年7 b項清單需要臨時的報告時間分析,引發了他們什麼,有多少,這些攻擊是否計劃或臨時,是否有統計先驗指南和停止規則。此外,它有助於知道一個獨立的數據監測委員會參與分析(和誰組成,特別注意資金來源)的作用,他們決定停止。通常數據安全和監視委員會提出建議和資助者(讚助商)或研究人員決定停止。

試驗停止原因顯然早期獨立的試驗結果,達到計劃終止試驗,不可能介紹偏差的停止。207年在這些情況下,作者應該臨時分析報告是否發生,這些結果是否可用的資助者。

推動試驗改變幹預應對中期業績,從而使快速發展的更快的評價有前途的幹預和致命的條件,需要更加謹慎的報告過程和早期決定停止試驗。208年

15項。一個表顯示每組基線人口統計學和臨床特點

的例子,見表4

表4

報告基線人口統計學和臨床特點的例子。表1 *(改編自Yusuf et al209年)

把這個表:

解釋,雖然合格標準(見4項)指出誰是合格的試驗,同樣重要的是要知道參與者的特征實際上是包括在內。這個信息讓讀者,尤其是臨床醫生判斷相關試驗的結果可能是個別病人。

隨機試驗的目的是比較不同組的參與者隻有對幹預(治療)。雖然適當的隨機分配防止選擇性偏差,它並不保證組在基線是等價的。任何基線特征的差異,然而,機會的結果,而不是偏見。32學習小組應該比較重要的基線人口統計學和臨床特點,以便讀者可以評估他們是多麼相似。基線數據尤其有價值的結果,也可以測量的試驗(如血壓)。

基準信息最有效地在一個表(見表4)。連續的變量,比如體重、血壓,數據應該報道的可變性,以及平均值。連續變量可以總結為每個組的平均值和標準偏差。當連續數據有一個不對稱分布,最好的方法可能是報價中值和百分位數範圍(第25和第75百分位數等)。177年標準誤差和置信區間不適合描述variability-they推論而不是描述性的統計數據。少量的有序分類變量(如第四階段的疾病我)不應被視為連續變量;相反,數字和比例應該為每個類別報道。48177年

不幸的是意義的測試基線差異仍然是常見的2332210年;他們報告在一半的50 1997年發表在領先的通用期刊上的相關試驗。183年這種意義測試評估的概率觀察基線差異可能是偶然因素;然而,我們已經知道,任何差異造成的機會。測試基線差異不一定是錯的,是不合邏輯的。211年這樣的假設檢驗是多餘的,可以誤導調查人員和讀者。相反,比較的基線應基於考慮預後變量測量和強度大小的任何失衡發生的機會。211年

16項。為每個組,數量的參與者(分母)包含在每個分析和分析是否由原始分配組

的例子,“所涉及的主要是意向處理分析和所有的患者被隨機分配。”212年

“一個病人alendronate組是輸給了跟進;因此數據從31日患者可用的意向處理分析。五個病人被認為是協議違反…因此26患者仍按方案分析。”213年

解釋,每組參與者的數量是一個重要的元素的分析。雖然流程圖(見13項)可能表明參與者的數量分析,這些數據經常變化不同的結果的措施。參與者的數量每組應給予分析。二進製的結果,(如風險率和風險差異)分母或事件率也應報告。表達結果分數也能幫助讀者在評估是否隨機分配的參與者被排除在分析之外。此前,結果不應僅僅總結措施,如相對風險。

參與者可能有時得不到完整的幹預,或一些不合格的患者可能是隨機分配的錯誤。一個廣泛推薦處理此類問題的方法是分析所有參與者根據原來的小組作業,不管後來發生什麼(見附表6)。這種“意向處理”策略並不總是簡單的實現。是常見的一些病人沒有完成一個研究可能輟學或退出積極治療,因此未被評估。如果結果是死亡率,這類病人可能被包括在分析基於注冊信息,而歸責技術可能需要使用是否其他結果數據丟失。“意向處理分析”一詞通常是開水不當的例子,當那些沒有收到第一個劑量的試驗藥物被排除在分析之外。18

相反,分析隻能局限於參與者履行協議的資格、幹預措施和結果評估。這種分析被稱為一個“治療”或“協議”分析。不包括參與者的分析可能導致錯誤的結論。例如,在一個試驗,將醫學與外科治療頸動脈狹窄,僅限於參與者可用於後續分析顯示,手術短暫性缺血性發作的風險降低,中風和死亡。然而,意向處理分析基於所有參與者最初分配沒有顯示一個優越的手術效果。214年

意向處理分析通常青睞,因為它能避免偏見的隨機損失有關的參與者。215年216年217年無論作者使用術語“意向處理”,他們應該明確和有多少參與者包括在每個分析(見13項)。不符合指定的治療可能意味著意向處理分析低估了治療的潛在好處,和額外的分析,如每個協議分析,可能會因此被認為是。218年219年然而,值得注意的是,這種分析往往是明顯的缺陷。220年

403年回顧相關的發表在2002年的10個主要醫學期刊,249年(62%)報告的使用意向處理分析的主要分析。這個比例是高期刊堅持CONSORT聲明(70%v48%)。文章中報道的使用意向處理分析中,隻有39%實際分析所有參與者隨機,有超過60%的文章在其主要缺失的數據分析。221年其他研究顯示類似的結果。18222年223年試驗報告沒有排除方法論上較弱的在其他方麵比那些報告排除一些參與者,173年強烈表明至少某些研究人員排除參與者不報告。另一項研究發現,報告意向性治療分析與良好的研究設計和報告的其他方麵,如描述樣本大小的計算。224年

箱6:意向處理分析

個隨機對照試驗的特殊力量是避免偏見當分配的幹預試驗參與者(見附表1)。這一優勢允許強大的推斷因果關係與其他研究設計不合理。為了保持完全隨機的巨大的利益我們應該包括所有參與者隨機分析,保留所有的組中分配。這兩個條件定義一個“意向處理分析,廣泛推薦的首選分析策略。18223年意向處理分析對應分析完全按照隨機分組。嚴格的意向處理分析往往是難以實現的兩個主要reasons-missing結果試驗參與者和沒有遵守協議。

丟失的結局

許多實驗排除患者沒有觀察到的結果。通常這是合理的,但是一旦任何隨機參與者被排除在分析不是嚴格意向性治療分析。事實上,大多數隨機試驗有失蹤的觀察。實驗有效地省略參與者沒有最終結果數據之間必須選擇改動或者他們失蹤的結果數據。225年“完成情況”(或“可用”)分析隻包括那些結果是已知的。盡管一些缺失的結果不會導致一個問題,在一半的試驗中10%以上的隨機患者可能缺失的結果。226年這種常見的方法將失去權力通過減少樣本大小,和偏見可能是如果被失訪患者對治療的反應有關。應該有擔憂當頻率或輟學的原因幹預組之間的差異。

參與者與失蹤的結果隻能包含在分析如果他們的結果估算(也就是說,他們的結果估計從其他信息收集)。歸責的缺失數據允許分析符合意向處理分析但是需要很強的假設,這可能是很難證明的。227年簡單的歸責方法是吸引人,但它們的使用可能是不明智的。特別地,一種廣泛使用的方法是“最後的觀察結轉”缺失的最後結果變量的值被之前的最後一個已知值取代參與者失去了跟進。通過它的簡單這是吸引人的,但該方法可能會引入偏見,228年也沒有考慮不確定性的汙名。229年許多作家嚴重批評去年觀察發揚光大。229年230年231年

沒有遵守協議

另一個問題是,審判協議之後可能沒有完全試驗參與者。常見的例子是參與者不符合入選標準(如錯誤的診斷,太年輕),收到了被禁co-intervention,並沒有把所有的治療,或者接受了一個不同的治療或沒有幹預。簡單的方法來處理任何協議偏差是忽略它們:所有的參與者都可以包含在分析無論堅持協議,這是意向處理方法。因此,排除任何參與者等原因不符合意向處理分析。

“修改意向處理”這個詞很廣泛用於描述分析,排除了那些不充分遵守協議,特別是那些沒有接受幹預最少的定義。232年另一個詞是“每一個協議。”Though a per protocol analysis may be appropriate in some settings, it should be properly labelled as a non-randomised, observational comparison. Any exclusion of patients from the analysis compromises the randomisation and may lead to bias in the results.

“意向處理”,這些其他標簽可靠地澄清哪些患者包括在內。因此,在配偶清單我們減少了意向處理分析的具體要求,以明確的描述完全包含在每個分析。

17項。對於每個主要和次要的結果,為每組結果,估計效果及其精度(如95%置信區間)

的例子,見表5和6

表5

例子每個研究小組的報告彙總結果(二進製的結果)。表2 *(改編自Mease et al103年)

把這個表:
表6

例子每個研究小組的報告彙總結果(連續的結果)。(改編自範Linschoten表3234年)

把這個表:

解釋,對於每一個結果,研究結果應報告為每組的總結的結果(例如,數量的參與者有或沒有事件和分母,或測量的平均值和標準偏差),連同之間的對比組,稱為效應大小。二進製的結果,效果可能是風險率(相對風險),比值比,或風險的區別;生存時間數據,風險比或平均存活時間差異;和連續的數據,它通常是不同的意思。置信區間應該呈現的對比組。一個常見的錯誤是單獨的置信區間的演示結果在每組而不是治療的效果。233年試驗結果往往更清楚地顯示在一個表,而不是在文本,如表5所示和6

所有的結果,作者應該提供一個置信區間來表示(不確定性)的估計精度。48235年95%置信區間是傳統的,但偶爾會使用其他級別。許多期刊要求或強烈鼓勵使用置信區間。236年他們尤其有價值差異之間的關係,不符合傳統的統計學意義,因為他們經常表明,結果並不排除一個重要的臨床差異。置信區間的使用明顯增加了近年來,雖然不是醫學專業。233年雖然P值可能提供除了置信區間,結果不應僅僅作為P值報告。237年238年結果應該報道計劃主要和次要終點,不僅對統計學意義或“有趣的分析。“選擇性報告研究中是一個普遍而嚴重的問題。5557在試驗中臨時分析,解釋應該關注最終結果在審判結束時,不是中期業績。239年

二進製和生存時間數據,表達結果還數量需要治療的好處可以幫助或傷害(見項目21)。240年241年

項17 b。二進製的結果,表示建議的絕對和相對效應的大小

的例子,“氧依賴或死亡的風險降低了16% (95% CI 25%到7%)。絕對差−6.3% (95% CI−−2.7% 9.9%);早期政府估計16嬰兒因此防止1嬰兒死亡或長期依賴氧氣”(也參見表7所示)。242年

表7

報告絕對和相對效應值的例子。表3(改編自奧西裏斯的協作組織242年)

把這個表:

解釋,當主要的結果是二進製,相對效應(風險比(相對風險)或優勢比)和絕對效應(風險差異)應該報道(置信區間),作為相對測量和絕對測量僅給出了一個完整的影響及其意義。不同的觀眾可能更喜歡相對或絕對風險,但是醫生和人們傾向於高估效應提出了相對風險。243年244年245年風險的大小差別不大generalisable其他人群的相對風險,因為它依賴於基線風險未曝光的集團,往往不同的人口。結果是常見疾病,附近的相對風險統一可能表明臨床上重要的公共衛生方麵的差異。相比之下,一個大相對風險時,結果是罕見的可能並不那麼重要對公共衛生(盡管它可能是重要的個體在高風險類別)。

18項。執行的任何其他分析結果,包括子群分析和調整分析,區分從探索性預先確定

的例子,”的基礎上的一項研究表明圍手術期β-blocker功效可能會隨基線風險,我們預定的主要亞組分析的基礎上,修訂後的心髒風險指數評分係統。我們也做了預定的二級子群分析基於性別、手術類型,並使用硬膜外或脊髓麻醉。為所有子群分析,我們使用Cox比例風險模型,結合測試交互,指定在p < 0.05…重要的圖3顯示了我們的指定子群分析的結果和顯示的一致性效果…我們的子群分析動力不足檢測子群的適度的差異影響,檢測是否有一個真正的子群效應”。One hundred.

解釋,相同數據的多個分析創建一個假陽性結果的風險。246年作者應該抵製誘惑,執行許多子群分析。183年185年247年分析指定的試驗協議(見項目24)更可靠的比建議的數據,因此作者應該報告分析判斷。如果進行亞組分析,作者應該報告子組檢查,為什麼,如果他們預定的,又有多少被指定。子群的選擇性報告分析可能導致偏見。248年當評估一個小組問題不在於小組展示了一個具有統計學意義的結果,但亞組治療效果是否顯著不同。為了確定這一點,測試交互是有益的,雖然這種測試通常是低的權力。如果正式評估交互進行(見項目12 b)他們應該報告為每個子群的幹預效應的估計差異(置信區間),不僅僅是P值。

在一項調查中,35 50試驗報告包括子群分析,其中隻有42%的人使用交互的測試。183年往往是很難確定子群分析中指定的協議。手術的另一個調查試驗中期刊發表高影響,72年的27日試驗報告54子群分析,其中91%是事後和隻有6%的亞組分析用的交互測試評估子群效應是否存在。249年

類似的建議適用於調整為基準變量的分析。如果完成,未經調整和調整分析應該報道。作者應該表明是否調整分析,包括變量的選擇調整,計劃。理想情況下,試驗協議應該狀態是否為指定基線調整變量使用協方差分析。187年調整為變量,因為他們在基線顯著差異可能偏差估計的治療效果。187年一項調查發現,不被承認的協議和出版物之間的差異被發現所有25個試驗報告子群分析和23 28試驗報告分析調整。92年

項目19。每組中所有重要的危害或意想不到的效果

具體指導看到配偶傷害。42

的例子,“病人經曆的比例之間的任何不利事件是類似rBPI21(殺菌/ permeability-increasing重組蛋白)和安慰劑組:168(88.4%)的203年190年和180年(88.7%),分別是患者低rBPI21比接受安慰劑11 12身體係統…患者出現嚴重不良事件的比例,根據調查,低數值rBPI21組比安慰劑組:53個(27.9%)的190年和74年(36.5%)的203名患者,分別。隻有三個嚴重不良事件報告為毒品,他們都發生在安慰劑組。”250年

解釋,讀者需要的信息危害以及幹預的好處做出理性和平衡決策。的存在和性質不良反應可以產生重大影響是否一個特定的幹預將被視為可接受的和有用的。不是所有報道不良事件觀察試驗期間必然是幹預的結果;一些可能的條件接受治療的結果。隨機試驗提供最好的方法以及療效數據提供安全數據,盡管他們不能發現罕見的傷害。

許多相關的報告提供不良事件信息不足。192年的一項調查顯示從1967年到1999年公布的藥品試驗顯示,隻有39%的人足夠的臨床不良事件報告和29%有足夠的實驗室報告定義的毒性。72年最近,比較之間的不良事件數據提交給美國國家癌症研究所的試驗數據庫,讚助試驗,在期刊文章和信息報告發現,低品位不良事件被低估了在期刊文章。優質事件(常見毒性標準等級3 - 5)在文章、報道的不一致和信息關於歸因試驗性藥物是不完整的。251年此外,回顧試驗6個一般醫學期刊發表在2006年至2007年發現,盡管89%的133份報告不良事件所提到的,沒有嚴重不良事件信息和撤回病人因不良事件有27%和48%的文章,分別。252年

CONSORT聲明的擴展提供了詳細建議傷害隨機化試驗的報告。42建議和例子適當的報告從配偶免費網站(www.consort-statement.org)。他們補充的配偶2010聲明,應該谘詢,尤其是危害的研究是一個重要的目標。簡而言之,如果數據收集不良事件,事件應該和定義,列出關於標準化在適當的地方標準。數據收集和使用的方法應該描述事件的歸因。為每一個研究部門每個不良事件的絕對風險,為重複事件使用適當的指標,參與者的數量由於危害應該提出撤回。最後,作者應該提供一個平衡的討論的好處和壞處。42

討論

20項。試驗的局限性,解決潛在的偏見的來源,不精確,如果相關,多重性的分析

的例子,“男性患者(85%)的優勢是我們的研究的局限性…我們使用裸金屬支架,因為藥物洗脫支架在權責發生製直到晚期才可用。盡管後者可能被視作一個限製因素,公布的數據顯示沒有好處(無論是短期或長期的)對死亡和心肌梗死在穩定的冠狀動脈疾病患者接受藥物洗脫支架,與那些接受裸金屬支架相比。”253年

解釋,科學報告的討論往往充滿言論支持作者的發現254年並提供小的測量參數研究的利弊及其結果。一些期刊試圖解決這一問題,鼓勵更多的結構,作者討論的結果。255年256年例如,內科醫學年鑒建議作者結構呈現的討論(1)的概述關鍵的發現,(2)考慮可能的機製和解釋,(3)比較與其他相關研究成果已發表的研究(隻要有可能包括係統回顧結合當前研究的結果與之前的所有相關研究的結果),(4)本研究的局限性(和方法用於最小化和彌補這些限製),和(5)做一個簡要的介紹,總結了臨床和研究意義的工作。255年我們建議作者遵循這些明智的建議,也許還在討論部分使用合適的副標題。

盡管討論限製經常省略了研究報告,257年識別和討論研究有特別重要的弱點。258年例如,一個外科小組報道,腹腔鏡膽囊切除術,技術上困難的過程,顯著降低並發症率比傳統的開放管理急性膽囊炎膽囊切除術。259年然而,作者沒有討論一個明顯的偏見的結果。研究人員已完成腹腔鏡膽囊切除術,而80%的膽囊切除術已經完成學員開放。

作者還應該討論任何的不精確的結果。可能出現不精確的幾個方麵的研究,包括測量的主要結果(見第6項)或診斷(見4項)。也許使用的規模是驗證一個成年人,但用於兒科,或評估員不是如何訓練的管理工具。

之間的差異統計學意義和臨床重要性應該承擔。作者應該特別避免常見的錯誤的解讀與結果表明等效的幹預措施。置信區間(見項17)提供了有價值的洞察審判結果是否符合臨床重要的效應,無論P值。120年

作者評估時要特別注意與多個對比試驗的結果。這樣多樣性來自幾個幹預,結果措施,時間點,子群分析,和其他因素。在這種情況下,一些統計上顯著的發現可能會帶來機會。

項21。Generalisability(外部有效性、適用性)的試驗結果

的例子,”作為幹預是實現男女,各個年齡段,各種類型的運動,在不同級別的運動,結果表明,整個範圍的運動員,從年輕精英中間和娛樂高級運動員,將受益於使用提出培訓計劃預防複發的腳踝扭傷。通過包括當中未治療和醫學治療的運動員,我們涵蓋了廣泛的損傷程度。這表明,目前的培訓計劃可以實現所有運動員的治療。此外,因為它是合理的假設踝關節扭傷無關與體育運動相媲美,該計劃可能會從中受益。”260年

“這複製和延伸克拉克和他的同事們的工作表明,CB(認知行為)預防計劃可以可靠地、有效地在不同的設置由臨床醫生以外的人最初的幹預。影響大小與先前的報道是一致的,單,表明抑鬱預防研究和健壯的跨站點對抑鬱症和症狀…在這個generalisability審判,我們選擇比較條件相關的公共health-usual保健…樣本也以工薪階層為主的中產階級提供醫療保險。給定證據表明CB治療的青少年可以更有效的收入高的家庭,這將是重要的測試這個預防計劃的影響更經濟和民族多元化樣本。”261年

解釋,也叫做generalisability或適用性,外部效度的研究結果可以普遍的其他情形。262年內部效度,在多大程度上設計並進行審判的消除偏見的可能性,是外部有效性的先決條件:一個有缺陷的試驗的結果是無效的,其外部效度的問題變得無關緊要。沒有絕對的外部效度;這個詞有意義的隻是關於明確指定的條件,沒有直接的檢查試驗。結果可以全麵個體參與者或組,不同於那些參與試驗對年齡、性別、疾病嚴重程度,和共病情況?結果適用於其他藥物的類內相似的藥物,不同的劑量,時間,和給藥途徑,和不同的療法嗎?類似的結果可以預期在小學,中學,和三級水平的護理?如何對相關結果的影響並不是評估試驗中,和後續治療和持續時間長度的重要性,尤其是對危害?263年

外部有效性的判斷,取決於參與者的特征包括在試驗,試驗設置,治療方案的測試和結果評估。5136年因此,關鍵是足夠的信息被描述對合格標準和設置和位置(見項目4 b)的幹預措施和它們是如何管理(見第五項),結果(見第6項)的定義,和招聘和隨訪期間(見14項)。對照組的參與者的比例的結果發展風險(對照組)也很重要。合格的參與者拒絕的比例進入試驗流程圖(見項目13)上所注明的相關generalisability的審判,因為它可能表明偏好或幹預的可接受性。類似的考慮可以申請臨床醫生的偏好。264年265年

幾個問題是重要的實驗結果應用於個別病人。266年267年268年雖然有些變化治療反應個體病人和病人之間在審判或係統評價是預期,差異往往是在大小而不是方向。

雖然有重要的例外,268年治療(尤其是藥物269年發現在一個狹窄的範圍是有益的的病人通常有更廣泛的應用於實踐。框架提出了外部效度的評估,包括定性研究,比如在積分“過程評價”270年和清單。271年措施納入基線風險計算治療效果時,如治療所需的數量來獲得一個額外的有利的結果,需要將生產一個不利影響,有利於評估benefit-to-risk平衡個體病人或一組特征不同於典型的試驗參與者。268年272年273年最後,經過推導病人集中估計的潛在益處和害處的幹預,臨床醫生必須將它們集成對治療病人的價值觀和偏好。同樣的考慮當評估結果的generalisability不同的設置和幹預措施。

22項。解釋與結果一致,平衡利益和損害,並考慮其他相關證據

的例子,1990年以前發表研究報告”表明預防性免疫療法也減少院內感染very-low-birth-weight嬰兒。然而,這些研究了少量的病人;采用不同的設計,準備,和劑量;,包括不同的研究群體。在這個大型多中心、隨機對照試驗,反複靜脈注射免疫球蛋白預防管理未能顯著降低院內感染的發生率在早產兒出生時重501 - 1500克。”274年

解釋,讀者想知道目前的試驗的結果與其他相關的。這最好可以通過包括一個正式的係統評價報告的結果和討論部分。83年275年276年277年這樣的審判作者合成可能是不切實際的,但通常可以引用一個係統回顧類似的試驗。係統回顧可以幫助讀者評估個隨機對照試驗的結果是否與其他相似的試驗在相同的話題,並且在研究參與者是否相似。相關的報道往往沒有充分處理這些點。277年貝葉斯方法可以用來統計結合試驗數據與先前的證據。278年

我們建議,至少,討論應該盡可能係統,是基於一個全麵的搜索,而不是局限於研究支持當前試驗的結果。279年

其他信息

23項。注冊登記號碼和名字的審判

的例子,“審判是在ClinicalTrials.gov登記號碼NCT00244842。”280年

解釋,幹脆不整個試驗的結果,281年282年選擇性報告結果的試驗中,每個協議而非意向處理分析已經被很好地記錄下來了。5556283年秘密冗餘發表的臨床試驗也會導致問題,特別是對於作者的評論來自同一試驗結果時無意中包含不止一次。beplay体育官网官方登录284年

減少或避免這些問題有重複調用過去25年注冊臨床試驗在《盜夢空間》,將獨特的試驗識別號碼,和其他記錄基本信息公開審判這至關重要的細節。285年286年287年288年最近嚴重的問題引發的預提數據,289年有了新的努力注冊隨機試驗。事實上,世界衛生組織指出,“登記所有介入試驗是一種科學、倫理和道德責任”(www.who.int ictrp / en)。通過注冊一個隨機試驗,作者通常報告一組最少的信息和獲得一個獨特的試驗注冊號碼。

2004年9月國際醫學期刊編輯委員會(ICMJE)改變了政策,說他們會考慮試驗發表隻有已注冊入學前的第一個參與者。290年這導致大幅增加數量的試驗被注冊。291年接受注冊(ICMJE給予指導www.icmje.org/faq.pdf)。

在165年最近的一項調查高影響因子醫學期刊的作者,44期刊特別指出,所有最近的臨床試驗必須注冊為雜誌的要求提交。292年

作者應該提供的名稱注冊和審判獨特的注冊號。如果作者沒有登記他們的審判應該顯式地聲明並給出原因。

24項。可以訪問完整的試用協議,如果可用嗎

的例子,“審判的全部細節協議補充附錄,可以找到與這篇文章的全文www.nejm.org。”293年

解釋,完成試驗協議(而不是一個特定過程在一個試驗)的協議很重要,因為它pre-specifies隨機試驗的方法,如主要結果(見6項)。有一個協議可以幫助限製未申報事後更改的可能性試驗方法和選擇性報告結果(見項目6 b)。可能是重要的元素包含在一個隨機試驗的協議描述。294年

有幾個選項供作者考慮確保他們的審判協議是有興趣的讀者beplay体育官网官方登录可訪問。在上麵的示例中,所述期刊報道可以使試驗的主要試驗結果協議可以在他們的網站。可訪問性試驗結果和協議是增強開放獲取期刊時。一些期刊(如試用)發布試驗方案,出版時可以引用報告試驗的主要結果。試驗注冊(見項目23)也將確保有許多試驗協議細節,作為最低試驗特性包括在批準試驗注冊數據庫包括幾個協議項目和結果(www.who.int ictrp / en)。審判人員也可以張貼他們的審判協議在網站上通過他們的雇主。無論使用何種機製,我們鼓勵所有的審判人員協議方便有興趣的讀者。

25項。資金來源和其他支持(如藥物)的供應,資助者的角色

的例子,收到“撥款支持的幹預計劃國際和研究來自威康信托基金會和聯合國艾滋病規劃署。投資者沒有參與研究設計、數據收集和分析,決定發表,或準備手稿。”295年

“這項研究是由葛蘭素史克製藥。葛蘭素史克公司參與的設計,進行研究和試驗期間提供後勤支持。讚助商與調查人員合作的員工準備統計分析計劃,但由猶他大學的分析。手稿是由Shaddy博士和指導委員會成員。葛蘭素史克公司被允許檢查手稿並建議更改,但最終決定內容被作者隻保留。”296年

解釋,作者應該對試驗報告的資金來源,因為這是讀者評估試驗的重要信息。研究表明,製藥行業讚助的研究更有可能產生的結果有利於產品由公司讚助的研究比其他研究資助的來源。297年298年299年300年係統回顧30研究資金資助的一項研究發現,製藥行業有四倍的幾率比研究成果有利於讚助由其他來源(優勢比為4.05,95%可信區間2.98到5.51)。297年目前大部分試驗出版物不報告的資金來源。漏報是難以量化的程度。370個藥品試驗的調查發現,29%未能報告的資金來源。301年在PubMed的另一個調查中,索引隨機試驗發表在2000年12月,據報道66%的519的資金來源試驗。16

參與水平的資助者和他們的影響設計,試驗不同的行為,分析和報告。因此重要的是,作者詳細描述資助者的角色。如果資助者沒有這樣的參與,所以作者應該狀態。同樣,作者應報告任何其他來源的支持,如藥物的供應和製備或設備,或在數據分析和寫作的手稿。302年

相關的報告,沒有兩組平行設計

友推薦的重點與並行設計和相關的兩個治療組。最相關的設計,但大量少數民族不:45%(233/519)的相關發表在2000年12月,162006年12月,39% (242/616)。17

大部分的CONSORT聲明適用於所有試驗的設計,但是有一些額外的問題解決為每個設計。之前出版的2001年修訂的CONSORT聲明,配偶小組決定開發擴展的主要CONSORT聲明相關的特定的試驗設計。擴展相關已發表報告集群隨機試驗40和non-inferiority等效試驗。39缺乏資源意味著其他擴展計劃尚未完成;他們將用以下設計:覆蓋試驗multiarm平行,階乘,交叉,within-person。

作者報告試驗與集群設計或使用non-inferiority或等效框架應該谘詢配偶除了這些建議在這個文檔。這裏我們做一些臨時評論其他設計。在每種情況下,試驗設計應明確表示,在這兩個主要的文字和文章的文摘。

Multiarm(> 2組)平行組試驗至少需要修改標準的配偶指導。流程圖可以很容易擴展。兩組的主要區別試驗與澄清的研究假設與多個組,和隨之而來的數據分析和解釋的方法。析因試驗,之間的交互幹預的可能性通常需要考慮。除了總體比較參與者做了或沒有收到每個幹預研究,調查人員還應考慮報告結果為每個治療組合。303年

在交叉試驗,每個參與者收到兩個(或更多)治療以隨機的順序。主要的額外問題解決與配對性質的數據,影響設計和分析。304年類似的問題影響within-person比較,參與者同時收到兩個治療(通常是成對的器官)。另外,因為時間或係統性的風險延滯效應,分別在這兩種情況下的選擇設計需要理由。

配偶集團打算發布擴展配偶涵蓋所有這些設計。此外,我們將發布現有指南的更新集群隨機試驗和non-inferiority和等效試驗考慮的重大更新通用配偶指導。

討論

評估醫療幹預措施可能會誤導人,除非調查人員確保公正的比較。隨機分配學習小組仍是唯一的方法,消除了選擇和混雜的偏見。Non-randomised試驗往往會導致估計治療效果比隨機試驗。305年306年

偏見危害甚至是相關的,但是,如果調查人員進行此類試驗不當。307年最近的係統回顧,聚合結果的幾個方法論的調查,發現,主觀的結果,試驗使用不充分或不清楚分配隱藏收益率為31%的估計效果比那些使用適當的隱藏,和試驗沒有蒙蔽了大25%的估計。153年正如所預期的那樣,兩者之間有一個強大的協會。

個隨機對照試驗的設計和實現需要方法論以及臨床專業知識,一絲不苟的工作,143年308年和高度的警覺性不曾預料到的困難。相關的報道應該用同樣密切關注減少偏見。讀者不應該猜測;方法應該完整和透明的,所以讀者可以很容易區分試驗與公正的結果從這些有問題的結果。合理的科學包含足夠的報告和道德審判的行為取決於聲音的基礎科學。309年

我們希望這更新的配偶解釋文章將協助作者使用2010版本的配偶和解釋方麵的重要性充分的試驗報告。CONSORT聲明可以幫助研究人員在未來設計試驗310年並能指導同行評議者和編輯手稿的評價。事實上,我們鼓勵同行評議者和編輯使用配偶的清單評估作者是否已經報道了這些項目。這樣的評估可能會提高出版的清晰度和透明度試驗。因為配偶是一個進化的文檔,它需要持續評估的動態過程,細化,,如果有必要,改變,這就是為什麼我們有這個清單和說明文章的更新。作為新證據和批判性評論積累,我們將評估未來更新的必要性。

CONSORT聲明的第一個版本,從1996年開始,似乎已經導致改善報告的相關期刊的質量,采用了它。5051525354。其他組織使用配偶模板來提高其他研究報告的設計,如診斷測試311年和觀察性研究。312年

配偶的網站(www.consort-statement.org)建立了提供教育材料和材料相關的存儲庫數據庫相關的報告。這個網站包括很多真實試驗的例子,包括在本文中所有的例子包括。我們將繼續向數據庫添加好的和壞的報告的例子,我們邀請讀者進一步提交建議通過網站聯係我們。配偶集團將繼續調查文獻找到相關文章,解決相關問題相關的報告,我們邀請任何此類文章的作者來通知我們。所有這些信息將通過配偶訪問的網站,定期更新。

超過400領先通用和專業期刊和生物醫學編輯組織,包括國際、世界醫學期刊編輯協會和科學委員會編輯,他們配偶的官方支持。我們邀請其他期刊關注臨床試驗報告的質量支持CONSORT聲明,通過我們的網站聯係我們,讓我們知道他們的支持。這些集體努力的最終受益者應該是人,不管出於什麼原因,需要來自社區醫療幹預。

筆記

引用這個:BMJ2010;340:c869

腳注

  • 我們感謝弗蘭克大衛杜夫和湯姆朗參與2001年版本的配偶的解釋和細化文檔。特別感謝瑪麗奧坎波,渥太華的配偶協調員,協助提供這紙和配偶語句的理解和闡述。

  • 配偶組貢獻者的配偶2010:道格拉斯·G奧特曼在醫學中心的統計數據,牛津大學,英國;弗吉尼亞巴伯,《公共科學圖書館·醫學》雜誌上英國;傑西柏林,強生製藥研發、美國;伊莎貝爾Boutron,巴黎大學7丹尼斯•狄德羅援助Publique des Hopitaux巴黎,由法國;加拿大麥克馬斯特大學PJ審視;凱Dickersin,約翰霍普金斯大學彭博公共衛生學院的美國;戴安娜Elbourne,倫敦衛生與熱帶醫學學院的英國;蘇珊•Ellenberg賓夕法尼亞大學醫學院的美國;Val Gebski、悉尼大學、澳大利亞;史蒂文•古德曼學會雜誌》上的臨床試驗美國;彼得·C Gøtzsche北歐科克倫中心、丹麥;崔西園,BMJ英國;史蒂文•格倫伯格美國臨床腫瘤學會、美國;加拿大麥克馬斯特大學的布萊恩·海恩斯,;莎莉霍普韋爾,在醫學中心的統計數據,牛津大學,英國;阿斯特麗德·詹姆斯,《柳葉刀》;美國強生彼得Juhn;菲利帕米德爾頓,阿德萊德大學,澳大利亞;美國加州大學歐文分校不Minckler;大衛·莫赫渥太華方法中心、臨床流行病學項目,渥太華醫院研究所,加拿大;維克多·M Montori知識和遇到的研究單位,梅奧臨床醫學院,美國;辛西婭·Mulrow內科醫學年鑒美國;斯圖爾特可以排除,倫敦衛生與熱帶醫學學院的英國;德拉蒙德蘭尼,《美國醫學會雜誌》美國;大衛·L Schriger急診醫學年鑒美國;美國家庭健康國際肯尼斯·舒爾茨F;個中知己赤道網絡,英國;英國的伊麗莎白打賭,側麵圖。

  • 資金:我們感激地承認金融支持來自英國國家健康研究所;加拿大衛生研究院的研究;總統基金,加拿大衛生研究院的研究;強生(Johnson & Johnson);BMJ;美國臨床腫瘤學會。

  • 為了鼓勵傳播2010年的配偶聲明,本文是自由訪問bmj.com,也將發表的臨床流行病學雜誌。本文作者聯合舉辦的版權。用於進一步的細節,請參見配偶網站(www.consort-statement.org)。

這是一個開放分布式根據條創作共用署名非商業性的許可證,允許使用,分布,在任何介質,和繁殖提供了最初的工作是正確地引用,使用非商業,否則按照許可證。看到的:http://creativecommons.org/licenses/by-nc/2.0/http://creativecommons.org/licenses/by-nc/2.0/legalcode

引用

視圖抽象
Baidu
map