條文本

原始研究
晚期上皮性卵巢癌原發性手術後殘留病變:專家引導練習,在有計劃的係統綜述和薈萃分析中探討發表偏倚的潛在影響
  1. 安德魯·科比1
  2. 邁克爾·格雷林1
  3. 肖恩Hiu1
  4. Ketankumar Gajjar2
  5. Eugenie約翰遜1
  6. 艾哈邁德·裏德3.
  7. 路加福音淡水河穀1
  8. 黎明克雷格1
  9. Raj奈克4
  1. 1人口健康科學研究所紐卡斯爾大學泰恩河畔紐卡斯爾、英國
  2. 2婦產科諾丁漢市醫院諾丁漢、英國
  3. 3.泛伯明翰婦科腫瘤癌症中心桑德維爾和西伯明翰醫院NHS信托伯明翰、英國
  4. 4北方婦科腫瘤中心伊利沙伯醫院蓋茨黑德、英國
  1. 對應到安德魯博士科比;andy.bryant在{}ncl.ac.uk

摘要

目標我們將專家意見及其納入計劃的元分析作為調整預期發表偏倚的一種方式。我們在有資格的英國婦科癌症協會(BGCS)具有婦科專業知識的成員中進行啟發性練習。

設計專家引出運動。

設置bgc。

參與者具有婦科專業知識的BGCS成員。

方法向專家們展示了一項有計劃的前瞻性係統綜述和薈萃分析的細節,評估了晚期上皮性卵巢癌初次手術後殘留病變(RD)切除程度的總生存率。研究人員詢問了參與者對不同研究(研究人群的大小和被比較的RD閾值不同)不發表的可能性的看法。進行描述性統計,並根據樣本量和效應量的大小估計缺失研究的總數。

結果包括18名專家受訪者。對於RD <1 cm與RD=0 cm的比較,應答者認為發表偏倚是可能的,但對於涉及較高體積次優RD閾值的比較,偏倚更為明顯。然而,專家在比較RD=0 cm與次優RD閾值時所感知到的發表偏倚並沒有轉化為引出練習的B部分中許多引出的缺失研究。對於RD<1 cm與RD=0 cm的主要比較,應答者估計的缺失研究的中位數為10 (IQR: 5-20),缺失研究的數量受影響大小是否模棱兩可的影響。次優RD與RD=0 cm的缺失研究估計中位數較低。

結論研究結果可能會提高人們的認識,當回顧比較RD <1 cm和RD=0 cm的研究時,需要一定程度的懷疑。受訪者也認為,涉及RD=0 cm和次優閾值(>1 cm)的比較可能受到發表偏倚的影響,但這不太可能削弱meta分析中的效應估計。

  • 婦科腫瘤
  • 婦科腫瘤
  • 統計與研究方法
  • 成人外科手術

數據可用性聲明

資料應合理要求提供。可應要求提供匿名數據集和/或提供額外的彙總統計數據。

http://creativecommons.org/licenses/by-nc/4.0/

這是一篇開放獲取的文章,按照創作共用署名非商業性(CC BY-NC 4.0)許可發布,該許可允許其他人以非商業性的方式發布、混編、改編、構建本作品,並以不同的條款授權他們的衍生作品,前提是原創作品被正確引用,給予適當的榮譽,任何更改都被注明,且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果您希望重用這篇文章的任何部分或全部,請使用下麵的鏈接,它將帶您訪問版權清除中心的RightsLink服務。您將能夠快速獲得價格和以多種不同方式重用內容的即時許可。

本研究的優勢和局限性

  • 在我們與高級婦科腫瘤學家合作設計的誘導練習中,受訪者的數量(n=18)足以為在一個不確定的領域得出有意義的結論提供堅實的基礎。

  • 誘導的A部分確定了出版偏倚值得關注的領域,但所問的問題不提供任何偏倚方向的指示。

  • 因此,在我們的誘導練習的B部分中,我們收集的信息將使任何計劃的元分析估計能夠根據出版偏倚的預期影響進行調整。

  • 所采用的方法成本低廉,易於設計和管理,不依賴與參與者的任何聯係,他們能夠在自己方便的時候完成。

  • 然而,專家對開放式問題的回答更傾向於“極端的回答偏見”。

簡介

晚期上皮性卵巢癌(EOC)前期原發性去體積手術(PDS)後殘留疾病(RD)被認為是總生存率(OS)的關鍵決定因素。最近的一項預後因素係統評估方案旨在證明在晚期EOC中完全切除RD與保留肉眼疾病(即外科醫生保留一些可見疾病)相比,在OS方麵的優越性。1

然而,這一領域的許多證據來自小型和/或回顧性研究。依靠這些研究來得出結論可能是不合理的。其中一個原因與可能的出版偏差有關,這在小型的回顧性評估中可能更為明顯。當研究結果的發表取決於結果的性質和方向時,就會產生發表偏誤。相比大型隨機對照試驗,小規模回顧性研究更有可能出現這種情況。2 - 6小型研究可能是動力不足的,此外,無效的發現可能是由於研究設計和操作的缺陷。因此,包括這些研究可能不會導致元分析估計的適當調整。這就是為什麼我們計劃在係統綜述中納入至少100例患者樣本量的研究。

因此,鑒於證據基礎的性質,可以假設發表偏倚會導致偏向於更徹底地取消研發,如下文所述。

與隨機試驗相比,小型回顧性研究也容易出現其他偏差,特別是選擇偏差(即在基線特征方麵,組間的係統性差異)。7 8此外,所有的研究設計都可能存在研究行為的不足,如盲目性不足、高磨損等。9日10同樣,在小型回顧性研究中,這些問題可能會加劇。

如上所述,出版和其他報道偏見11日12可能會對研究產生嚴重後果,並影響研究結果的總結和指南中的建議。13日14如果懷疑發表偏倚是高度可信的,這可能使從元分析中得到的效果估計不確定和潛在的不可靠。當考慮到評估晚期EOC PDS後RD的OS的係統評估結果時,這是一個值得關注的問題。1

在本綜述中,支持估計的數據將來自對收集到的數據的進一步分析,以解決其他研究問題。為解決其他問題而收集的數據的事後分析和對過去醫療記錄的二次分析不需要預先指定任何地方,因此存在數據挖掘的強烈威脅。因此,報告這些數據的個別研究可能取決於他們的發現的意義。例如,有可能隻有產生“重要”發現的分析才會被發表。因此,任何薈萃分析都可能高估完全細胞減少的效果。即使許多未報告的研究規模很小,這也可能是正確的,因為它們對meta分析的累積影響可能具有實質性的總體影響。

對發表偏倚的探索是一個穩健的係統綜述的重要組成部分,應該始終加以考慮。目前,對於識別和調整發表偏倚的標準方法還沒有達成共識,盡管存在一些方法,特別是關於識別的方法。減少發表偏倚可以通過堅持良好的審查實踐來實現,例如對灰色文獻的徹底搜索。15 - 17日事後統計方法,如漏鬥圖,18修剪和填補,19日20還有文件抽屜號21也可以使用。此外,當有證據表明發表偏倚或這種偏倚被高度懷疑時,選擇模型22日23日可用於調查發表偏倚對元分析結果的影響。然而,這通常需要在分析中包含大量的研究12日24任何調整通常都需要對潛在選擇模型的假設。12日22

一個可能更實際的方法是將外部信息合並到元分析中。這些外部信息可以從各種來源收集,並使用貝葉斯框架進行合並。25日- 27日但是,這種方法隻有在從可靠來源獲得外部信息時才有用。最後一點是我們研究的重點,因為我們提出了一種迄今為止在元分析中很少受到關注的方法:考慮專家意見,並將他們的觀點和意見納入元分析,以便為調整提供信息。我們通過在合格的英國婦科癌症協會(BGCS)成員中進行啟發性練習(基於相關的職位和婦科專業知識),以確定他們在計劃的前瞻性係統綜述和薈萃分析中對發表偏倚的潛在性質和程度的專家意見,評估晚期EOC PDS後RD的OS。1誘導操作與計劃的係統評審的進行有關,該操作的結果將用於調整擬議的元分析,以消除任何可察覺的發表偏倚。

在啟發式練習中,我們要求參與者說明:(1)已經進行但尚未發表的研究的種類;(2)任何發表偏倚的合理程度和方向;(3)對發表偏倚發生的原因和方式的可能解釋。這些數據可用於調整我們計劃的meta分析結果的發表偏倚,meta分析評估了EOC初次手術後RD閾值的OS。

方法

案例研究

這項研究涉及了研究或試驗環境之外的人類參與者。征集活動不需要倫理上的批準,因為它是發給BGCS成員的,參與是可選的。參加誘集工作的任何專家的資料都是保密的。

參與者被告知了一項計劃中的前瞻性係統回顧和meta分析的細節,評估了RD切除程度的OS(見在線補充附錄1).這將包括來自100例或更多患者的研究或病例係列的數據,包括對患有晚期EOC的成年女性初次手術幹預後不同RD閾值的同步比較。感興趣的結果是不同類別的RD的OS。

為了案例研究的目的,參與者被告知,截至2020年1月的書目數據庫被用於搜索相關數據,以便他們對每個場景的響應有一個截止點。參與者被告知,兩名評審作者將獨立抽象數據並評估偏差風險,如果可能,數據將在元分析中合成。該綜述中使用的方法的全部細節在Cochrane係統綜述中提供1並在啟發式練習中總結了納入標準在線補充附錄1

本綜述的目的是評估前期和間隔期去體積手術後RD對生存結局的影響。然而,本文的重點和誘導練習是在早期原發性手術後不同RD閾值的OS。

啟發式練習設計

啟發式的目的是詢問受訪者對研究不發表的可能性的意見。之後,我們詢問了他們對幾種不同情況的看法,所有這些情況都與不同研究無法發表的可能性有關。這些未發表的研究因研究人群的規模和RD閾值作為OS預後因素的影響而有所不同。

在與四位婦科腫瘤學家協商後設計了啟發式練習,以幫助確保就練習的目的提供足夠詳細的解釋,並清楚地說明方法和理由。使用可視化的例子使被調查者的問題盡可能透明。

通常,專家的意見是直接通過訪談方法或通過誘導練習得到的。在這兩種情況下,意見可能隻需要由四名專家提供。28 29然而,建議使用更多的專家,使結果更具普遍性,並允許更廣泛的觀點的可能性。30 31專家之間的任何廣泛分歧都可以反映在得出的估計的不確定性上;最基本的是受訪者在感興趣的領域擁有廣泛的知識和專業知識。

啟發式練習由A、B、C三部分組成(在線補充附錄1提供啟發練習的一個例子)。A部分采用了已有的啟發式方法,30.而B部分使用了一種從頭開始的工具,旨在提供一種從元分析中獲得缺失研究數量估計的方法。受訪者還指出了這些缺失研究的規模,可用於以95% CI的HR形式計算影響的量級。下麵將更詳細地描述A和B部分。C部分用於衡量受訪群體對報告更普遍的偏見的態度,這裏沒有報道。

為了幫助被調查者回答A部分和B部分的問題,我們提供了對生存模型中常見報告的統計數據的解釋的簡要指導(參見《生存模型》中“專家誘導”的介紹部分)在線補充附錄1).

專家啟發式部分

這部分包括一個問題(Q1),並試圖通過詢問受訪者對不同宏觀RD閾值(RD>0 cm)與完全細胞減少參照比較器(切除腫瘤,使肉眼看不到疾病,RD =0 cm)的發表機會的比較的看法來評估發表偏性。具體來說,對於每個比較,假設研究的樣本量在最小樣本量(n=100)(這是計劃綜述的納入標準的一部分)和最大樣本量(這個最大樣本量是基於截至2020年1月的初步結果範圍內納入研究的meta分析中觀察到的樣本量)之間變化。

然後,研究人員要求應答者在0(不可能發表)到100(肯定發表)的範圍內,為報告了給定樣本量的給定比較的一項研究的發表概率賦值。該假設研究的其他特征遵循Bryant在係統回顧方案中設定的納入標準1這些已在上麵總結,並在在線補充附錄1

專家啟發式B部分

B部分包括三個廣泛的問題,目的是獲得答複者對可能存在的已進行但未發表的研究估計數量的意見。對於每個問題,參與者被要求考慮一個特定的宏觀RD閾值,並將其與RD =0 cm: Q2 (RD <1 cm vs RD =0 cm)進行比較;Q3 (RD >1 cm vs RD =0 cm);和Q4 (RD >2 cm vs RD =0 cm)。隨後,參與者被要求按照李克特量表(Likert Scale)從1(完全不可能)到5(極有可能)進行評估,評估那些有利於宏觀疾病的相關研究,或那些在宏觀疾病與RD =0 cm之間的生存沒有統計學意義差異(p>0.05)的研究,將不會發表。

接下來,受訪者被要求估計有多少具有一定規模和影響程度的研究可能未發表,以及他們回答的理由。未發表研究的樣本量從100增加到>500。效應量,作為調整後的HR報告,同樣以0.1的遞減變化,在1到≤0.5之間。總的來說,受訪者被要求考慮36種不同的假設組合的樣本量和效應量的未發表研究的數量。與RD =0 cm相比,在RD閾值為次優的情況下(>1 cm和>2 cm)重複這些問題(見第3-4題)在線補充附錄1).

對B部分問題的回答可以用來調整觀察研究的總體效果估計,當添加了未觀察研究的數據時。

數據收集和抽樣

問卷調查小組負責審核有關的啟發式活動;他們的有益建議被納入,並由BGCS管理員通過電子郵件向會員分發使用Qualtrics完成的啟發練習的鏈接。本會製定了透過會員電郵目錄分發網上調查的指引,並在征集工作中遵守指引,並應本會要求向本會索取。2020年8月13日至10月26日開放了誘導演習的鏈接,並發出了兩份提醒。研究的參與是自願的,潛在的受訪者被告知,誘導的結果將為出版物提供信息。所有確認都是在回應者同意的情況下給出的;所有提供的開放文本回複都是匿名的,我們明確排除了按職位名稱交叉表格,因為這可能會損害匿名性。

數據分析

采用描述性統計方法對誘導練習的回答進行總結。詳情請見在線補充附錄1.對於B部分的答複,我們也在在線補充附錄2舉例說明如何通過每個問題的樣本量和效應量的大小來使用這些回答形成對缺失研究總數的總體估計,報告為HR和95% CI。所有分析均在StataIC V.15中進行。32

患者和公眾的參與

一個也沒有。

結果

受訪者的特點

當時,所有455名BGCS成員都收到了啟發練習,超過80%的人有資格完成。共有98名諮詢委員會成員打開了演習的連結,28名繼續瀏覽參加者資料表。其中,18名受訪者完全完成了誘導練習,他們的回答報告如下。其餘10名參加者對分析工作的貢獻不足(圖1).

圖1

啟發式練習流程圖。

完成練習的專業知識的分布也呈現在圖1.大多數應答者是婦科腫瘤顧問醫生(11/18;61%)或次級專家顧問(4/18;22%)。完成運動的中位時間為18分鍾(IQR 16-27分鍾),範圍為8-61分鍾。平均完成時間為23 min (SD為14 min)。

A部分:概率估計:針對RD =0 cm的不同宏觀RD疾病發表的具有最小和最大指定樣本量的研究

表1顯示了基於不同RD閾值(均與RD =0 cm比較)比較的樣本量的一項研究被發表的感知概率。回應表明,在樣本量僅為100的研究中,發表偏倚很可能存在。例如,應答者表示,他們認為在一項樣本量為100名參與者的研究中,RD <1 cm與RD =0 cm的比較出現的幾率不到60%。

表1

與微觀疾病(0 cm)相比,對於給定樣本量的殘留疾病閾值研究,應答者的感知發表機會(概率)的彙總統計

總體而言,結果存在廣泛的差異,表明一些應答者認為發表的概率比其他人高得多(範圍為0%-100%)。應答者似乎表明,在宏觀疾病體積較大的比較中,發表的概率最低(在宏觀疾病涉及RD >2 cm vs RD =0 cm時,最大的中位概率為20% (IQR: 10%-75%),在RD >5 cm vs RD =0 cm時,低至3.5% (IQR: 0%-50%)。

受訪者還表示,當研究樣本量較大時,一些比較可能存在發表偏倚。然而,對於RD <1 cm與RD =0 cm、RD >1 cm與RD =0 cm的比較,應答者似乎忽略了發表偏倚的威脅。均值和中值概率更高,接近100%,表明受訪者高度肯定研究將被發表。與RD =0 cm相比,涉及較大體積的次優RD(更大的宏觀疾病體積)的比較被認為在更大的研究中發表的概率較低(涉及>2 cm的宏觀疾病的最大得到的中位概率為30% (IQR: 15%-80%),而對於RD 1-5 cm和>5 cm的概率要小得多)。這與小型研究的結果一致。

B部分:感知發表偏倚的可能性和缺失研究的估計

表2顯示大多數應答者承認,在RD <1 cm與RD =0 cm的比較中,發表偏倚的可能性是“有點”或“相當”(72.5%),隻有一個應答者(5.5%)認為根本不可能。對於次優RD >1 cm與RD =0 cm的比較,這一觀點完全相反,大多數應答者認為發表偏倚“根本不可能”。

表2

在比較接近最佳(<1 cm)和次最佳(>1/2 cm)與完全細胞減少(0 cm)時,應答者感知發表偏倚的可能性

對於RD <1 cm與RD =0 cm的比較,應答者估計的缺失研究的平均值和中位數分別為17 (SD 16.5)和10 (IQR 5-20) (表3).在涉及次優宏觀疾病量(RD閾值為>1 cm)的比較中,估計遺漏研究的平均數量較低。對於RD >1 cm與RD =0 cm的比較,應答者估計的缺失研究的平均值和中位數分別為8.6 (SD 12.9)和5 (IQR 0 - 10) (表3).應答者估計RD >2 cm與RD =0 cm比較的平均缺失研究數為6 (SD 13.2),中位數為0.5 (IQR 0 - 5) (表3).

表3

在比較接近最佳(<1 cm)和次最佳(>1/2 cm)與完全細胞減少(0 cm)時,應答者感知發表偏倚可能性的彙總統計

表4裏麵的表格在線補充附錄3和附錄4表明,在受訪者看來,可能缺失的研究數量可能受到那些缺失研究的效應大小的影響。例如,對於RD <1 cm與RD =0 cm的比較,17項研究中平均9.4項研究的HR為1。隨著HR的增加,被認為缺失的研究越來越少,當檢測到的HR為0.5時,被認為缺失的研究的平均數量小於1。考慮到所有被受訪者認為缺失的研究,我們估計了一個加權平均人力資源。對於RD <1 cm與RD =0 cm的比較,缺失研究的效應量的加權平均HR為0.83 (95% CI 0.77 - 0.90)。這一HR是根據估計缺失研究的總共3906名參與者和2500例死亡計算的,5年生存率為36% (表4).

表4

近最佳RD <1 cm與完全細胞減少(0 cm)的未發表研究的大小和大小分布的分解

同樣,對於RD >1 cm與RD =0 cm的比較,應答者估計的平均缺失研究數為8.6 (表3).缺失研究的加權平均HR估計HR為0.77 (95% CI為0.70 ~ 0.85);這是估計使用相同的方法如上所述,在在線補充附錄3.對於RD >2 cm與RD =0 cm的比較,應答者估計的平均缺失研究數為6.2 (表3).加權平均HR估計為0.79 (95% CI 0.71 ~ 0.89;看到在線補充附錄4有關數據的更多細節)。

通過應答者對發表偏倚可能性的意見強度對結果進行進一步分析。根據這些發表可能性子組中的應答者(“完全不可能”、“有點可能”、“很可能”;“非常或極有可能”)導致RD <1 cm與RD =0 cm比較的估計HR為0.90 (95% CI 0.79至1.03)(表5).對於RD >1 cm與RD =0 cm、RD >2 cm與RD =0 cm的比較,這些分析沒有重複,因為應答者的意見轉向了一種普遍的感覺,即發表偏倚“根本不可能”。根據RD <1 cm與RD =0 cm,已進行但未發表的研究估計數量的範圍載於表5,但按研究規模和效應規模劃分的範圍沒有給出,但可以根據作者的要求獲得。

表5

應答者對於RD <1 cm與RD =0 cm之間缺失研究的可能性的意見強度和所引出的研究數量

討論

主要研究結果

誘導練習可能會吸引對根治性手術有偏激觀點的專家,這對於獲得有代表性的意見來通知前輩是有用的。26研究發現,在評估EOC PDS後RD <1 cm與RD =0 cm的OS時,專家認為發表偏倚是一種可能。相比RD =0 cm和>2 cm的次優RD閾值,這種可能性大大降低,大多數受訪者(83.5%)認為,與RD =0 cm和>2 cm的次優RD閾值相比,這種可能性根本不存在。最顯著的發現是,專家們一致認為,在亞理想細胞減少與完全切除的比較中,不需要對發表偏倚進行任何調整,而不考慮作用和手術偏好。

誘導練習的平均完成時間比預期的30-60分鍾要快。這可能是由於一些應答者在之後的訪問中完成該練習之前先看了一眼。這可能有助於解釋7.7分鍾的最快完成時間。這一假設與演習的設計是一致的,因為我們允許在第一次訪問後的24小時內完成。在未來的工作中,我們將考慮進行敏感性分析,探討排除完成時間可能不現實的響應的影響。

優勢和局限性

誘導練習是與高級婦科腫瘤學家合作設計的。這是給出詳細解釋的主要原因,並提供可視化的例子,以確保潛在的受訪者清楚要求他們完成的任務。這涉及到在解釋清楚和可能阻止一些受訪者參與之間的權衡。我們的觀點是,從更少的受訪者中獲得更廣泛的場景數據,比從更多的受訪者中獲得更少的場景數據更有價值。這並不被認為是一個重大的限製,因為有人認為,在征求專家意見的工作中隻需要4-16名專家的意見。28-31得到的樣本量(n=18)遠遠高於這一數字。

誘導練習的A部分以現有的誘導方法為基礎。30.這一部分用於確定出版偏倚值得關注的領域。在此基礎上,B部分探討了潛在的偏倚方向。因此,在我們的誘導練習的B部分中,我們收集的信息將使元分析估計能夠根據發表偏倚的影響進行調整。該方法雖然實用,但依賴於可獲得的準確生存估計,因為這些被用於告知研究規模。如上所述,它還要求有足夠數量的專家提出意見(即4-16人)。28-31

專家對開放式問題的回答傾向於“極端的回答偏見”。因此,我們使伴隨啟發式練習的指示相當廣泛。我們在設計這項工作時詳細討論了這一點,我們認為,如果對估計研究的數量設置上限,將會引入更多的偏差。計劃進一步研究極端反應對得出的結論的影響。

從任何專家誘導活動中收集的信息是否可以被認為是相對效果的可靠估計,這是值得懷疑的。因此,將其納入調整的元分析可能會導致CI顯示的“更精確”估計,但這些估計可能並不被認為更可靠(即我們獲得了精度,但可能引入了另一種偏差)。結果顯示在表1和表318位受訪者給出的答案似乎有變化。因此,需要進行一係列敏感性分析,以測試總體結論對所用先驗值的變化的魯棒性。

對研究人員和政策製定者的影響

已經提出了許多建議,以幫助在係統審查中防止發表偏倚,例如預注冊,33對期刊審稿人和編輯的負麵或無效發現的開放態度,34使用預打印服務來改善文件抽屜的問題,35鼓勵不顧期刊影響的發表——這常常被合並為研究質量的衡量標準。36這些可能會提供一個解決方案,並將發表偏差最小化。然而,它們並非沒有問題。這就需要一種方法,讓我們能夠探索和描述發表偏倚的影響。我們提出的專家誘導方法可以幫助這一探索。

啟發式練習提供的結果可能有助於調整通過發表偏倚元分析得到的估計效應大小。應答者估計,大量參與者的數據可能缺失(例如,RD <1 cm vs 0 cm的比較估計超過3900);這可能會對meta分析的結果產生影響。特別地,來自啟發式練習的回答可以用來形成元分析的貝葉斯先驗;具體來說,先驗可以用來調整從元分析中得到的觀察效果估計,以探索發表偏倚的預期影響。來自受訪者的“有根據的猜測”是這一領域中可能促進此類調整的唯一實質性信息來源。在這種情況下,這種方法的使用可能特別重要,因為人們普遍認為存在選擇性報道,而且有未發表的研究可能會提供“不顯著”或“負麵”的結果。如果從誘導得到的估計被用來調整比較RD <1 cm, RD > 1 cm和RD >2 cm與RD =0 cm的meta分析,我們預計這將從任何meta分析中稀釋HR的點估計,這些meta分析表明腫瘤細胞減少到RD =0 cm的婦女在OS中有好處。然而,在這種特殊情況下,點估計值周圍的精度將有所提高。

在線補充附錄2,我們概述了從收集到的數據中形成這種先驗的一種方法。在這種方法中,對於不同RD閾值與RD =0 cm的比較,給予每個調整的權重是不同的。例如,對於RD <1 cm與RD =0 cm的比較,受訪者估計更多的缺失研究包括更多的參與者。因此,RD <1 cm與RD =0 cm的比較對meta分析中的任何調整都有更大的影響。然而,對於RD >2 cm與RD =0 cm的比較,來自元分析的估計將受到較小的影響,因為該測試的應答者之間的共識是對發表偏倚的關注要少得多。此外,我們的說明性方法賦予每個應答者相同的權重,使他們對前麵的啟發做出相同的貢獻。然而,我們注意到,有可能探索給予不同群體不同的權重。如果我們相信不同的群體對缺失數據的性質和程度有不同的看法,這可能是相關的。

在評估晚期EOC的PDS後次佳RD OS的meta分析中,證據相對稀疏,尤其是RD閾值>2 cm與RD =0 cm相比。例如,在我們的初步結果範圍內(為促進誘導練習的A部分所必需),隻有一項研究直接比較RD >2 cm與RD =0 cm,還有三項研究提供了與這種比較相關的間接證據。這四項研究僅包括478名婦女,她們為RD >2 cm和RD =0 cm的比較提供了數據。在這種情況下,先前預期對發表偏倚的性質和程度的影響可能會對估計產生很大影響。然而,隨著證據的積累,在對元分析結果進行調整時給予先驗的權重將會減少。

對臨床醫生

發表偏倚可能導致在一組文獻中對治療效果或預後因素的療效產生錯誤的印象。37 38在我們的專家誘導練習的背景下,發表偏倚似乎在RD <1 cm和RD =0 cm的比較中最容易發生。這可能是由於很難確定手術是否已經完全切除了所有腫瘤,因為仍然可能存在肉眼可見的疾病。先驗預期是,這會使效應估計偏向於接近最佳的細胞減少(RD <1 cm)。專家認為,比較>1 cm和RD =0 cm的次優細胞減少的發表偏倚的可能性非常低。如果文獻正麵偏向於某一結論,那麼元分析將反映這一趨勢。雖然有一些輔助方法可以幫助識別和揭露發表偏倚,比如漏鬥圖,18他們決不是問題的全麵解決辦法。

研究表明,來自文獻的證據並不是臨床決策的唯一決定因素。臨床醫生也傾向於通過相對非正式的來源,如他們的臨床同事和同行的學術專家,進行“基於共識的決策”。討論和交換觀點的機會被視為收集信息和製定判斷的有價值的交流。39 40因此,在製定臨床指南建議時,專家誘導可用於探索不確定領域的影響。

對未來研究的啟示

我們工作的延伸可能是建立在元分析中使用個體患者數據(IPD)的想法上,41而不是使用聚合數據。IPD可以更容易地納入一致選擇的混雜因素進行調整,這將減少選擇性報告分析和結果的影響。IPD分析還將允許對混雜因素進行全麵的進一步探索,這可能包括查看混雜因素之間可能的相互作用影響。42

此外,可能並不一定是遺漏的研究是發表偏倚的唯一原因;係統的審查也可能傾向於選擇性地報告已發表研究的結果和分析。9 43-45這是一個經過全麵批評的領域,可以通過進行IPD元分析在很大程度上克服它。42由於了解到選擇性報告在考慮的領域中極有可能發生,演習的參與者可能將這一因素考慮到他們的誘導估計中,因為實際上,這等同於一項缺失的研究。

結論

先前的meta分析證據表明,EOC的完全細胞減少與OS的增加相關。然而,我們對18位專家的調查也表明,在這一領域存在著對發表偏倚的性質和程度的擔憂。值得關注的是,與RD <1 cm相比,未發表的證據可能會大大減少甚至消除建議的完全細胞減少對OS的好處。這些結果可能會讓人們意識到,在回顧比較RD <1 cm和RD =0 cm的研究時,需要一定程度的懷疑,特別是當這些證據來自非隨機的,有時是事後分析時。在製定臨床指南建議時,專家誘導可用於探索不確定領域的影響。然而,受訪者強烈認為,與RD >1 cm相比,完全細胞減少有更好的生存結果,而發表偏倚與這種看法無關。

數據可用性聲明

資料應合理要求提供。可應要求提供匿名數據集和/或提供額外的彙總統計數據。

倫理語句

病人同意發表

倫理批準

這項研究涉及了研究或試驗環境之外的人類參與者。征集活動不需要倫理上的批準,因為征集活動是發給BGCS成員的,參與是可選的。參加誘集工作的任何專家的資料都是保密的。參與者在參與研究前給予知情同意。

致謝

作者感謝來自BGCS的Debbie Lewis對引導練習的大力支持。作者也感謝BGCS組織和調查委員會幫助改進了征集活動的內容,並提供了向成員傳播的機會。對每個場景的判斷都是基於英國婦科癌症協會(BGCS)成員樣本的個人意見,並反映了他們自己在這一領域的經驗。他們不一定代表BGCS作為一個組織的觀點。

參考文獻

補充材料

  • 補充數據

    這個網絡僅文件已由BMJ出版集團從作者提供的電子文件生產(s),並沒有編輯的內容。

腳注

  • 推特@AndrewBryant82

  • 貢獻者AB是該研究的主要作者和概念化方法學方麵的研究,起草了論文,進行了統計分析,並作為擔保人對整體內容負責。MG是這篇論文的資深統計學家,他對論文的方法論進行了回顧、分析,並對論文的各個部分進行了批判性的輸入。SH是一名統計學家,他對論文的各個部分進行了批判性評估,並在調查設計方麵提供了專業知識。KG和AE作為高級婦科腫瘤學家和研究人員提供臨床專業知識和批判性審查。EJ對論文進行了批判性的審查,並提供了證據合成方麵的研究經驗。LV和DC是資深的研究學者,他們嚴格審查了方法和結果,並參與了討論。RN是一名婦科腫瘤學家,他提出了臨床研究的概念,並嚴格地投入到方法和討論中。所有作者審閱並批準了最終版本。

  • 資金作者們還沒有從任何公共、商業或非營利部門的資助機構為這項研究宣布具體的資助。

  • 相互競爭的利益沒有宣布。

  • 患者和公眾的參與患者和/或公眾未參與本研究的設計、實施、報告或傳播計劃。

  • 來源和同行評審不是委托;外部同行評議。

  • 補充材料本內容由作者提供。它沒有經過BMJ出版集團有限公司(BMJ)的審查,也可能沒有經過同行評審。討論的任何意見或建議僅僅是那些作者(s)和不被BMJ認可。BMJ放棄從放在內容上的任何依賴產生的所有責任和責任。如果內容包含任何翻譯材料,BMJ不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南、術語、藥品名稱和藥物劑量),並且不對翻譯和改編或其他原因引起的任何錯誤和/或遺漏負責。