條文本
摘要
客觀的目的:根據美國SEER數據庫的數據,評估老年人原發性肝癌的危險因素,構建老年人原發性肝癌預後的nomogram模型。
方法采用SEER*STAT軟件從SEER數據庫中提取最新的原發性肝癌患者數據,納入所需變量。對數據進行篩選,然後分為訓練隊列和驗證隊列。通過單變量和多變量Cox分析篩選變量,構建nomogram模型。采用C-Index、ROC曲線和校準曲線進行模型評價。
結果從2004年至2017年共提取10824例符合條件的病例,其中7757例納入培訓隊列,3247例納入驗證隊列。模型的c指數為0.747(訓練隊列)和0.773(驗證隊列)。訓練組和驗證組的3年曲線下麵積(auc)分別為0.760和0.750,5年aus分別為0.761和0.748。標定曲線表明,所建模型具有理想的標定效果。
結論經Cox回歸分析構建的nomogram模型具有中等的校準性和鑒別性,可為今後老年原發性肝癌的臨床應用提供一定的參考。
- 癌症遺傳學
- 成人腫瘤
- 基因治療
數據可用性聲明
應合理要求提供數據。本研究中使用和/或分析的數據集可根據合理要求從通訊作者處獲得。
這是一篇開放獲取的文章,根據創作共用署名非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此基礎上進行構建,並以不同的條款許可其衍生作品,前提是正確引用原始作品,給予適當的榮譽,任何更改都已注明,並且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/.
數據來自Altmetric.com
本研究的優勢和局限性
從SEER數據庫中收集了大量的老年肝癌病例。
為老年肝癌患者構建了一個新穎而理想的預後模型。
可能存在選擇偏差,因為所有病例都是從同一個數據庫中檢索的。
SEER數據庫中進行的一些分類不夠具體。
SEER數據庫中沒有輔助測試等信息。
簡介
根據流行病學調查,原發性肝癌目前是全球第六大常見癌症,是全球癌症相關死亡的第四大原因,對整個人類人口的健康構成重大威脅。1 2此外,許多研究指出,盡管中年(30 - 59歲)或年輕(<30歲)原發性肝癌患者在世界範圍內並不少見,但該病的平均診斷年齡為60歲。此外,與年輕患者的年齡標準化發病率(ASR)逐年下降相反,在過去30年裏,超過一半的國家和地區老年患者的發病率持續上升。3 - 5全球人口擴張、老齡化加劇以及老年人肥胖、糖尿病、過度用藥和HBV(乙型肝炎病毒)感染的滯後效應可能是導致老年原發性肝癌患者ASR較高甚至增加的原因,給各國衛生部門帶來沉重負擔。6 - 8手術仍然是治療原發性肝癌的首選。因此,根據原發性肝癌的流行病學特點和治療方式,有必要準確評估老年原發性肝癌患者的預後,以指導臨床實踐。然而,不同的病理類型和疾病的異質性仍然使其預後評估困難。
近年來,nomogram模型因其建模方法方便、可納入多變量等方麵優於傳統TNM (Tumor Node Metastasis.)分期的預測性能而受到廣泛歡迎。9日10本研究旨在基於SEER (Surveillance, Epidemiology, and End Results)數據庫構建nomogram模型,分析老年原發性肝癌的危險因素,並預測該病的預後。通過判別和校正檢驗,對模型的評價效果進行了分析,建立了一套適合老年原發性肝癌患者治療等臨床實踐的最佳評價體係。
方法和數據
患者和公眾參與
沒有病人參與。
病例選擇
使用SEER*Stat V.8.3.6從2004-2017年SEER數據庫中選擇隨訪記錄完整的原發性肝癌病例數據(SEER研究數據,18個登記處,2019年11月Sub(2000-2017))。
入選標準:
族群有亞洲人、太平洋島民、美國印第安人和阿拉斯加人。
原發性肝癌的主要部位為肝髒或肝內膽管(IBD)。
原發性肝癌的組織學類型為肝內膽管癌(ICC)、肝細胞癌(HCC)和相關肝癌(合並肝癌,CHC)。
排除標準:
65歲以下患者。
隨訪記錄不完整。
Non-tumor-related死亡。
人種、診斷年份、年齡、性別、原發部位、組織學類型、分級、TNM分期、腫瘤大小、原發部位手術(包括光動力治療、經皮乙醇注射、射頻消融術等)、生存時間、死亡原因、生存狀況等均為提取變量。其中選取65歲以上患者;亞洲人和太平洋島民、美國印第安人和阿拉斯加土著被包括在內,作為亞洲人和其他種族的變量;以肝或IBD為原發部位;組織學類型選擇ICC、HCC和CHC。
統計處理
生存終點和生存時間分別定義為3年和5年。使用X-Tile軟件,通過“枚舉法”將不同的值分組為臨界值進行統計檢驗,p值最小的結果視為最佳臨界值。得出高、中、低風險變量分別為<46 mm、46 - 81 mm和>81 mm。之後,所有病例采用SPSS V.18.0軟件,以20200222為隨機數,按7:3的比例隨機分配到訓練隊列或驗證隊列,收集基線信息。采用R軟件或SPSS進行單變量和多變量(Forward: LR) Cox分析,篩選具有統計學意義的變量構建nomogram,並據此計算C-Index、ROC曲線和曲線下麵積(area under the curve, AUC)。在Bootstrap采樣1000次後,用R軟件繪製模型3年和5年的校準曲線。p<0.05為有統計學意義。
結果
病例的臨床特征
根據篩選條件共提取原發性肝癌老年患者10 824例,其中訓練隊列7757例,驗證隊列3247例。其中以男性(67.5%)、白人(71.3%)為主,原發部位在肝髒(87.8%)、HCC(84.7%)、II級(46.6%)、T1(46.5%)、N0(91.6%)、M0(88.7%)、未手術(56.5%)(表1).
篩查預後危險因素。
對訓練隊列進行單因素Cox回歸分析,年齡、性別、種族、組織學類型、分級、TNM分期、手術和腫瘤大小等變量均有統計學意義(p<0.05),並納入隨訪的多因素Cox分析。然而,根據分析,原發部位被排除(p=0.232) (表2).隨後,通過Forward: LR多元Cox (表3).最終,年齡、種族、組織學類型、分級、TNM分期、手術和腫瘤大小均為影響老年原發性肝癌患者預後的獨立危險因素,可用於構建nomogram預測模型。
Nomogram模型構建與驗證
根據上述分析得出的影響疾病預後的獨立危險因素,構建早期原發性肝癌3年、5年nomogram預測模型。通過將各變量的得分相加來計算總分,從而預測患者的3年和5年生存率(圖1).由此可見,影響該模型評分的最重要因素是原發部位的手術,其次是腫瘤大小、TNM分期和年齡。模型的c指數為0.747(訓練隊列)和0.773(驗證隊列)。繪製訓練組和驗證組的ROC曲線後計算AUC。具體而言,訓練隊列的AUC為0.760(3年)和0.761(5年),驗證隊列的AUC為0.750(3年)和0.748(5年)。圖2).此外,在為訓練和驗證隊列創建校準曲線後,該模型顯示了兩組3年和5年生存預測的理想校準(圖3).通過比較nomogram模型與TNM模型的預測價值,可知其3年AUC分別為0.758、0.698 (p<0.05), 5年AUC分別為0.750、0.609 (p<0.01) (圖4.).
討論
病例分析顯示,男性患者占所有老年原發性肝癌患者的60%以上。一些統計數據顯示,在美國,男性患此病的年平均變化率高於女性(3.7% vs 2.7%)。11在中國,浙江省一項基於人群的肝癌研究表明,男性肝癌的ASR為33.24,女性為1.21。12不僅生活方式的差異——包括飲酒和吸煙——導致了男性更高的癌症發病率,而且不同的生理狀況,如激素分泌,甚至遺傳差異可能是造成這些流行病學差異的原因。13因此,有人提出,性別是一個關鍵的生物學變量,在所有旨在改善癌症的研究中都應該考慮到這一點。14對基線數據的分析還表明,老年原發性肝癌患者以白人為主,主要部位在肝髒,HCC組織學類型,II級(中分化),T1,無淋巴結轉移或遠處轉移。此外,在這一人群中,超過一半的病例沒有接受手術治療。出現這種現象的原因可能是患者確診時年齡大多在60歲以上,錯過了根治性手術的最佳時機。此外,考慮到患者身體功能的下降以及對手術的不耐受,大多數患者選擇姑息治療。
基於進一步的單因素和多因素Cox分析,我們得到了幾個影響疾病預後的獨立危險因素,包括年齡、種族、組織學類型、分級、TNM分期、手術和腫瘤大小。性別雖然如前文所述不可忽略,但綜合分析後,並不是影響該人群預後的主要因素,這與目前幾項關於肝癌的回顧性研究一致。15 - 17日一些影響手術的臨床信息,如轉移性腫瘤,可以在TNM分期中反映出來。從組織學類型上看,CHC的預後明顯差於普通HCC,發病率較低,但惡性程度較高。18 19年齡因素分析顯示,患者年齡越高,預後越差,呈線性負相關趨勢。nomogram模型也顯示手術是影響疾病預後的最關鍵因素。雖然接受肝移植的患者數量較少,但預後較好,其次是切除或肺葉切除術,局部破壞。相比之下,未經手術的患者預後相對較差。僅這一因素就將3年和5年的預測生存率降低到50%以下,這表明改善老年原發性肝癌患者預後的新方法或強化手術的發明仍然迫在眉睫。其他因素對疾病預後的影響基本符合目前的共識,級別越差,t分期越高,發生淋巴結轉移,發生遠處轉移,腫瘤越大,患者預後越差。
通過C-Index、ROC曲線和校準曲線對所建立模型的性能進行評價。若nomogram模型的C-Index和AUC大於0.7,則認為該模型具有較好的判別能力。20 21由於本研究構建的模型在訓練隊列和驗證隊列中兩個指標均在0.7以上,且校準圖均按照參考線分布,說明該模型具有較好的鑒別和校準能力,具有較好的預測疾病預後的能力。
然而,本研究也有不足之處。首先,本研究中的病例全部來自美國SEER(監測、流行病學和最終結果)數據庫,該數據庫對美國以外的地區不具有代表性,並且存在選擇偏差。此外,該數據庫納入的病例數據缺乏一些與肝癌診斷和治療相關的重要輔助檢測,如CEA、AST、血管侵犯等。更重要的是,該數據庫中包含的放化療信息隻能通過簽訂一些協議才能獲得,暫時無法獲得,因此我們無法研究放化療、靶向治療與肝癌預後之間的關係。22
我們的統計結論也存在不足。由於時間和技能的限製,我們的模型並沒有達到一個理想的狀態,其AUC僅為0.75,仍有改進的空間。這在一定程度上影響了預測的準確性,降低了預測的可信度。在未來,我們將繼續完善我們的nomogram模型,使其達到更精確的程度。
綜上所述,利用SEER數據庫中的病例數據進行單變量和多變量Cox篩查後,建立了具有中度預測的nomogram模型,可為今後老年原發性肝癌患者的診斷和治療提供參考。
數據可用性聲明
應合理要求提供數據。本研究中使用和/或分析的數據集可根據合理要求從通訊作者處獲得。
倫理語句
患者發表同意書
倫理批準
從美國SEER數據庫獲取數據不需要患者的知情同意,因為美國每個州的癌症都是公開報告的。
參考文獻
腳注
貢獻者FL撰寫並修改了手稿;TZ進行了大部分的數據分析;小高審閱了手稿。XG完全可以訪問研究中的所有數據,對研究的進行、數據的完整性和數據分析的準確性負責,並控製發表的決定。所有作者都閱讀並批準了最終的手稿。
資金作者沒有從任何公共、商業或非營利部門的資助機構宣布對這項研究的具體資助。
相互競爭的利益沒有宣布。
患者和公眾參與患者和/或公眾沒有參與本研究的設計、實施、報告或傳播計劃。
出處和同行評審不是委托;外部同行評審。