條文本

原始研究
乳腺癌的風險預測模型:係統回顧
  1. 雅迪鄭1,
  2. 江李1,
  3. 鄭吳1,
  4. 他李1,
  5. 曹毛毛1,
  6. 倪李1,2,
  7. 傑他3
  1. 1辦公室的癌症篩查,國家癌症中心/國家臨床研究中心癌症癌症醫院,中國醫學科學院,北京協和醫學院,北京,中國
  2. 2江蘇癌症生物標記物的關鍵實驗室,預防和治療,江蘇癌症個性化醫療協同創新中心、南京醫科大學,南京,中國
  3. 3美國胸外科,國家癌症中心/國家臨床研究中心癌症癌症醫院,中國醫學科學院,北京協和醫學院,北京,中國
  1. 對應到倪博士李;nli在}{cicams.ac.cn;江博士李;他們在}{cicams.ac.cn

文摘

目標旨在係統綜述和批判性評價乳腺癌的風險預測模型的研究發表在一般人群沒有乳腺癌,並為未來的研究提供證據。

設計係統回顧使用預測模型研究偏見的風險評估工具(PROBAST)框架。

數據源搜索PubMed, Cochrane圖書館和Embase從開始到2021年12月16日。

合格標準我們包括研究報告多變量模型來估計發展中女性的個性化風險乳腺癌不同民族之間。搜索隻局限於英語。

數據提取和合成提取兩個評論者獨立篩選、審查和評估研究與差異通過討論解決或第三個審稿人。根據PROBAST偏見的風險評估框架。

結果63 894研究篩選和40研究47風險預測模型包括在審查中。大多數研究使用邏輯回歸為白人女性患乳腺癌風險預測模型通過病例對照數據。使用最廣泛的風險因素是生殖因素和最高的曲線下的麵積為0.943 (95% CI 0.919 - 0.967)。所有的模型包括在審查了高風險的偏見。

結論沒有推薦給乳腺癌的風險預測模型不同民族和模型結合乳腺密度或單核苷酸多態性在亞洲女性很少,不需要。高質量的乳腺癌風險預測模型評估PROBAST應該開發和驗證,特別是亞洲女性。

普洛斯彼羅注冊號CRD42020202570。

  • 流行病學
  • 公共衛生
  • 乳腺腫瘤
  • 風險管理

數據可用性聲明

所有數據都包含在相關研究文章或上傳在線補充信息。當前研究中存在的所有數據在主手稿,數據表和在線補充材料。

http://creativecommons.org/licenses/by-nc/4.0/

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 徹底進行了係統回顧從現有數據庫主要收集數據。

  • 批判性評價乳腺癌的風險預測模型的研究發表在一般人群,為未來的研究提供證據。

  • 預測模型研究偏見的風險評估工具(PROBAST)被用來評估預測模型的質量,開發通過共識過程涉及一組方法論專家領域的臨床預測工具和質量評估。

  • 隻有外部驗證的研究風險模型並不包括在審查。

  • 我們的研究強調高質量的乳腺癌風險預測模型評估PROBAST應該開發和驗證在不同民族、特別是亞洲女性。

介紹

乳腺癌是一個重大的公共衛生問題,其中最嚴重的癌症女性在世界範圍內,1占新癌症病例的11.7%和6.9%的癌症死亡在2020年。乳腺癌的發病率預計將增加在未來的幾年裏,2020年是女性中最常見的癌症。2乳腺癌預防與減少死亡率,3和需要更多的研究來改善的方法識別和防止疾病風險上升的女性。許多患乳腺癌的風險預測模型已經開發識別乳腺癌的風險因素的綜合效應,引導常規篩查和基因檢測,減少乳腺癌的負擔。Risk-stratified篩查可以提高成本效益和效益最大化和最小化傷害喜歡過度診斷。4乳腺癌的個性化預測模型可用於實踐,協助決策質量篩查或機會性篩查和治療策略。

最近的乳腺癌篩查指南5表明,乳腺癌篩查提高早期發現率,減少發病率是否適當應用於高危人群篩查。然而,主要的差距存在於我們的知識準確地確定患乳腺癌的風險以應用這些方法適當數量的女性。

很多患乳腺癌的風險預測模型已經發展在過去的幾十年裏。許多患乳腺癌的風險模型進行驗證包括研究人群的歧視和校準以外在初始開發使用,或在比較研究得到進一步評估。乳腺癌相關預測因子包括荷爾蒙因素、環境因素、家族史、遺傳因素和影像學因素都是基於在這些風險模型,這將提高generalisability。例如,蓋爾模型,6最著名的模型,在世界範圍內得到了廣泛的應用和驗證,因為它是在1989年開發的。7 - 12

本研究是一項係統回顧乳腺癌風險預測模型通過薈萃分析和預測模型研究偏見的風險評估工具(PROBAST)。13日14我們研究的目的是係統綜述乳腺癌的風險預測模型的研究發表在一般人群,找到更多的方法預測女性乳腺癌風險之間的一個或多個民族,準備風險預測模型的發展,並為未來的研究提供證據。

方法

目前的審查是根據清單為關鍵的評估和設計數據提取預測建模研究的係統評價。15

文獻搜索和合格標準

我們係統地搜索PubMed Cochrane圖書館和Embase從開始到2021年12月16日。詳細的搜索策略報告在線補充表1。搜索的文章確定加載到尾注V。X7和重複的刪除。

入選標準:(1)從橫斷麵研究,模型數據隊列研究、病例對照研究和隨機對照試驗;(2)模型估計的個性化風險女性乳腺癌中一個或多個民族;(3)模型的一般人群沒有乳腺癌;(4)公布了多變量(即至少兩個變量或預測)模型和(5)發表在英語。

排除標準:(1)外部驗證研究,隻有驗證了先前的模型在不同的人口沒有增加任何額外的信息,比如修改風險因素和(2)開發的機器學習模型。

數據提取

兩個評論家獨立篩選搜索結果。全文報告被評估資格的差異通過討論解決或第三個審稿人。

我們提取信息兩類:(1)對所有研究包括在審查中,我們提取以下信息:作者、出版年、研究設計、研究方法,有針對性的人口數量的風險因素,風險因素,性能和樣本容量的發展模式。(2)研究包括驗證部分,我們還提取以下信息:類型的驗證,研究設計,有針對性的人口,模型性能和樣本容量的驗證。一位評論家提取的信息和檢查第二個審稿人。

偏見的風險評估

我們使用PROBAST評估報告預測模型,這是一個新工具設計的世界各地的一組專家評估偏差的風險和適用性的診斷和預後預測模型。它可以用於研究開發的關鍵評估、驗證或更新個性化預測的預測模型。13日14簡而言之,它包含20個信號在四個領域的問題:參與者,預測結果和統計分析。可能信號問題可以回答,是的,是的,不,可能沒有或沒有信息。域,至少一個信號問題是回答不可能或不應該判斷偏差的風險很高。隻有在所有領域都是判斷低風險的偏見,總偏差作為低風險評判。

將PROBAST投入使用之前,我們成立了一個10人研究小組包括預測模型研究人員、統計人員,循證醫學專家等學習和適當的使用這個新工具係統地練習。隻有每個人都完全理解所有這些20個問題之後,我們會轉移到同伴質量評估的部分。偏見的風險預測模型是由兩個獨立評論員差異評估通過討論解決或第三個審稿人。

如果有一個以上的模型開發的一項研究中,我們隻評估偏見一旦由於他們相似的風險。我們也評估外部驗證的風險預測模型進行時在同一篇文章中,包括模型的發展。

數據合成和分析

我們計算和報告描述性統計總結的特征模型。我們計算最常用的風險因素和分類風險因素分為八類:年齡、生育因素,癌症家族史,激素相關基因因素,生活方式,病史和測試,和基本信息。分類中可以看到細節在線補充表2。然後我們使用網絡圖的連接風險因素的範疇。我們使用森林圖來描述模型的性能。預期的觀察(E / O)比並不包括在森林裏的情節,因為隻有在40 7的研究報道。所有分析使用占據V.16.0 NetDraw。

病人和公眾參與

沒有病人或公共參與這項研究。

結果

研究選擇

總共有92 519個索引記錄(54 653 PubMed 30 374年Embase Cochrane圖書館和7492年),625年28消除所有數據庫中複製,總共有63 894的出版物。43文章主要包括篩選後標題和摘要。三個研究,隻有外部驗證之前的模型被排除在外而完整的測試篩選,導致40研究47模型包含在最終評審(圖1)。

圖1

首選項報告係統評價和薈萃分析流程圖。

研究特點

簡要概述了406 16-54包括研究提出了在線補充表3。包含的研究從1989年到2021年出版。25所進行的研究在過去十年有5個研究發表於2017年。十七歲的40個研究使用病例對照研究數據開發預測模型,6 17日19日23日29-31 39 41 43 46 49 51 5413從未來的軍團,16 18 - 27 33-37 40 528從嵌套病例對照研究28 38 42 44 47 48 50 53從橫斷麵研究和2。32個4531個研究使用邏輯回歸預測模型,6 17日至19日22日至26日28-32 34 38-51 53 54七個使用cox比例風險回歸,20 21 27 33 35 36 52使用泊鬆回歸16和一個使用競爭風險回歸。37所有47個模型在40的研究中,16個模型被開發的白人女性,6 16 18 23日26日28 29 34 40 42 45 47 50 5313在多個種族的女性,24 - 27日30 35-38 44 4812在亞洲女人,17日19日31日32 39 43 49 51 522在非裔美國婦女,25 332在西班牙裔婦女,411在尼日利亞的女性46把你在塞浦路斯的女性。54

八個類別的風險因素之間的關係所示圖2。生殖因素最大節點大小,這意味著這個因素是最常與其他因素在預測模型。兩個因素之間的數量意味著時間這兩個因素都是包括在相同的模型,其中一些是超過30。例如,生殖因素和癌症家族史的40倍,包括在相同的模型和生殖因素和年齡為31倍被包括在相同的模型。

圖2

網絡圖的八個分類風險因素(年齡,基本信息,癌症家族史,相關基因因素,激素,生活方式,病史和測試,和生殖因素)。

29 c-statistics研究報道,在18到22歲的代謝途徑30 - 42 34-40 43 45-48 50 - 54範圍從0.59 (95% CI 0.57 - 0.61), 0.943(95%可信區間0.919到0.967)。邱51c-statistics最高(0.943,95%可信區間0.919到0.967),和李嗎19和薩利赫45曲線下的麵積(AUC)報告說超過0.8,0.867和0.864 (95% CI 0.81 - 0.92),分別。E / O比率可以從八個研究獲得。22日27日29日32 35 36 46 52圖3顯示整個AUC為0.68 (95% CI 0.63 - 0.73) 16研究21日26日27日30 32 34 37 38 42 45 46 48百分比較54報道了AUC和95%可信區間。子組的auc五個研究18 22日31日39 47在0.6和0.7之間。

圖3

曲線下的麵積(AUC)和獨聯體包括報告的研究。

40在所有這些研究中,九個研究評估預測模型與內部驗證,22日26日27日33 39 44-4710與外部驗證,23日25日29日31日37 41 49。51號~ 53號和1兩。3215項研究報告AUC歧視性的精度,23日25 27 29 33節37 39 41 46 49。51號~ 53號和11個研究使用預期/觀察事件比率(或觀察/預期事件比率)來衡量模型的校準精度。23日25日27日29日31 33 37 41 45 49 52

質量評估

質量評估的摘要所示表1。總的來說,所有的模型評估PROBAST審查有高風險的偏見。有偏見的風險低和高的結果和分析領域,分別。60%以上模型在參與者的低風險領域和大約70%的模型在預測領域,低風險分別為32模型和36模型(如圖所示圖4)。

圖4

偏見的風險評估(使用PROBAST)的所有評估模型基於四個領域。PROBAST,預測模型研究偏見的風險評估工具。

表1

總結偏見的風險評估

高風險的主要原因分析域模型性能評估措施不當,連續預測的分類,沒有報告模型過度擬合和樂觀的性能和缺失數據處理不當(在線補充表4)。

討論

主要結果的總結

這個係統確定40研究47風險預測模型開發和/或驗證乳腺癌不同民族之間。大多數研究使用邏輯回歸為白人女性患乳腺癌風險預測模型通過病例對照數據。使用最廣泛的風險因素是生殖因素。生殖因素一起家族史因素被用於大多數模型。最高的AUC為0.943 (95% CI 0.919 - 0.967)從邱51整個AUC為0.68 (95% CI 0.63 - 0.73) 16研究21日26日27日30 32 34 37 38 42 45 46 48百分比較54報道了AUC和95%可信區間。所有的研究提出了一個高偏差由於高風險的風險分析領域,這主要是由於模型性能評估措施不當,連續預測的分類,沒有報告模型過度擬合和樂觀的性能和缺失數據處理不當。

協議與其他評論和分歧

我們可以學習複習,有越來越多的乳腺癌的風險預測模型在過去的30年。大多數的模型被開發的白人女性,同意Louro發布的係統評價55與本文相比,我們發現更多的預測模型和使用新出版的工具來評估包括模型的質量。

在過去的十年裏,一些新變量(如口服避孕藥、糖尿病和酒精消費)已包括在預測模型。增加使用包含常見的遺傳變異的預測模型是符合Louro55和Anothaisintawee56然而,其中既包括模型等發達與潛在生物標記腫瘤相關抗原。相比之下,我們包括一個模型由秋51包括五名腫瘤相關抗原。模型表現良好高AUC 0.943 (95% CI 0.919 - 0.967)。

這項研究的優勢和局限性

PROBAST開發通過共識過程涉及一組方法論專家領域的臨床預測工具和質量評估。我們用它來評估預測模型的質量,已在許多領域得到廣泛應用年度因為它出來了。

盡管力量,有四個主要的局限性。首先,我們沒有係統地搜索灰色文獻。因此,一些模型可能並不確定。其次,質量評估可以認為是主觀的,它是一個係統回顧固有的偏見。然而,兩個獨立的評論者提取並評估的風險預測模型使用PROBAST作者表示客觀的指導方針和解釋。此外,研究隻有外部驗證的風險模型中未包含的評論,但這些風險模型的原始發展都淹沒了。例如,這項研究描述了蓋爾的原始發展模型6包括在我們的研究,而研究隻有蓋爾模型的外部驗證嗎61 - 64不包括在內。更重要的是,論文對麵向基因模型像博阿迪西亞65 66和BRACAPRO67年並不包括在我們的研究,因為一些罕見的刪除/致病性變異BRCA1和BRCA2等需要測試,這可能太過昂貴的用於一般人群的大規模篩選。55

暗示研究和臨床實踐

11個模型19日30 - 43 37-39 45 50 54選擇預測基於單變量分析,導致分析高風險領域,應該避免。風險預測模型應該包括預測那些已經成熟,而且臨床信譽無論任何統計學意義。68 69因為有時預測隻有重要的關係混淆的結果調整後,和協變量包括共時沒有獨立的預測能力。70年13

一些模型在分析高風險領域,因為缺失數據處理不當,可能導致偏見的風險因素和乳腺癌之間的聯係以及偏置模型的性能,因為選擇性的參與者。71年因此歸咎技術應該適用於數據時失蹤。72 73

當開發風險預測模型,隻有九個研究包括內部驗證,22日26日27日33 39 44-47大多數模型沒有內部驗證。缺乏執行內部驗證可能會增加風險的過度擬合。74年因此,我們建議內部驗證之前應該進行外部驗證。

PROBAST是由許多國際專家,提供一係列的準則對模型開發和驗證,可以很容易地應用和提高預測模型的臨床實踐。因此,應該使用新的最推薦的方法當一個新的模型是開發或更新現有的模型。

根據我們的審查,結果仍很難推薦的任何模型應用於乳腺癌篩查由於高風險的偏見。添加變量如乳腺密度或單核苷酸多態性(snp)風險預測模型可以提高模型的性能,驗證了一般人群的歐洲血統的女人。40 75 - 80但模型結合乳腺密度或單核苷酸多態性在亞洲女性很少,不需要。成本效益應該考慮當一個模型是應用於臨床實踐。因為即使模型與一些風險因素,成本(如高危基因)模型具有更好的性能,它仍然是很難被應用在貧困地區。81年更重要的是,必須在使用前進行修改或更新現有的模型在另一群人與不同的特征,這可能會提高預測模型的性能。

乳腺癌發病率已上升至第一位到2020年世界各地,這使得它更患乳腺癌的關鍵預測模型為不同的民族。在中國,我們已經推出了許多乳腺癌篩查項目。例如,農村婦女“兩癌”檢查項目管理解決方案有31個省和1437個縣進行了自2009年以來。癌症篩查項目在中國城市由國家癌症中心已覆蓋28個省、67個城市,400萬人參與,200萬多人接受超聲波和自2012年以來,乳房x光檢查。該計劃將為美國提供大量數據開發一個高質量的乳腺癌風險預測模型在中國,亞洲女性的乳腺癌預防具有重要意義。

結論

所有47個模型評估了在我們的審查使用PROBAST執行偏差的風險很高,離開不推薦常規篩查項目的模型。一些新的變量,如口服避孕藥、糖尿病和酒精消費,已經廣泛應用於預測模型在過去的十年。模型將乳腺密度或單核苷酸多態性在亞洲女性很少,不需要的。有必要開發和驗證質量的乳腺癌風險預測模型在不同民族、特別是亞洲女性。

數據可用性聲明

所有數據都包含在相關研究文章或上傳在線補充信息。當前研究中存在的所有數據在主手稿,數據表和在線補充材料。

倫理語句

病人同意出版

倫理批準

本研究不涉及人類參與者。

引用

補充材料

  • 補充數據

    僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。

腳注

  • 貢獻者YZ JL概念化的研究和創建的第一個版本審核協議。ZW,霍奇金淋巴瘤,MC,問和JH批判性回顧了審查協議和批準它。YZ和HL篩選合格的文章。YZ提取數據,支持ZW, MC。YZ起草的第一個版本手稿,由傑,問和JH。所有作者導致數據解釋和批判性的評估。所有作者批準了最終版本的手稿。問負責整體內容作為擔保人。

  • 資金這項工作是支持的非盈利中心研究所中國醫學科學院基金(授予數量:2019 pt320027)。

  • 相互競爭的利益沒有宣布。

  • 病人和公眾參與病人和/或公眾沒有參與設計,或行為,或報告,或傳播本研究計劃。

  • 出處和同行評議不是委托;外部同行評議。

  • 補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。