條文本
摘要
客觀的四期臨床試驗通常在批準後用於調查藥物安全性。然而,我們對當代IV期臨床試驗的特點以及這些研究是否具有足夠的質量來提高藥物警戒方麵的醫學知識知之甚少。我們的目標是通過使用ClinicalTrials.gov注冊數據來確定評估藥物安全性的IV期臨床試驗的基本特征。
方法下載了在ClinicalTrials.gov上注冊的19 359項IV期臨床研究的數據集。將僅關注安全性的IV期臨床試驗的特征與同時評估安全性和有效性的臨床試驗進行比較。我們還比較了三個主要治療領域(心血管疾病、心理健康和腫瘤學)的IV期試驗的特點。beplay体育相关新闻多變量邏輯回歸用於評估與使用盲法和隨機化相關的因素。
結果共確定了4772項IV期試驗,其中330項僅關注藥物安全性,4392項同時評估安全性和有效性。大多數評估藥物安全性的IV期試驗(75.9%)入組率<300,96.5% <3000。在這些試驗中,8.2%被終止或撤回。與使用盲法和隨機法相關的因素包括幹預模式、臨床專業和牽頭發起人。
結論在ClinicalTrials.gov注冊表中評估藥物安全性的IV期試驗主要是小型試驗,這些試驗可能沒有足夠的能力來檢測不太常見的不良事件。以安全性監測為主要任務的IV期試驗應強調足夠的樣本量。
這是一篇開放獲取文章,根據創作共用屬性非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此作品的基礎上進行構建,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
數據來自Altmetric.com
本研究的優勢和局限性
我們在ClinicalTrials.gov注冊表中提供了目前評估藥物安全性的IV期臨床試驗組合的全麵描述性評估。
我們采用logistic回歸模型來確定在評估藥物安全性的IV期臨床試驗中使用盲法和隨機法的相關因素。
我們遵循了嚴格的分析過程,這一過程被廣泛用於分析來自ClinicalTrials.gov的數據,以得出令人信服的結果。
一些臨床試驗沒有在ClinicalTrials.gov上注冊。
某些數據字段不可避免地會丟失一些數據,這可能會給結果帶來一些偏差。
簡介
藥物不良反應是一個主要的全球健康問題,僅在美國,每年就有超過200萬人受傷、住院和死亡,1在發達國家,每年的成本高達數十億美元。2盡管所有新藥都需要嚴格的上市前研究,3.,4由於I-III期試驗的一些特點,例如樣本量有限、持續時間短和嚴格的納入/排除標準,藥物在監管機構批準時的安全性概況通常是不完整的。5大約20%的藥物在上市後獲得了新的黑箱警告,4%的藥物最終因安全原因被撤回。62007年,食品和藥物管理局獲得了《食品和藥物管理修正案》(FDAAA)的授權7要求上市後臨床試驗以解決特定藥物的安全性問題。與上市前的I-III期試驗相比,IV期研究評估了真實環境下的藥物安全性,這可能為確保或進一步完善已批準藥物的安全性提供證據。5,8,9然而,我們對當代IV期臨床試驗的特點以及這些研究是否具有足夠的質量來提高藥物警戒方麵的醫學知識知之甚少。
ClinicalTrials.gov是由美國國家醫學圖書館代表美國國立衛生研究院(NIH)建立的一個公共試驗登記處,於2000年2月首次推出。10自2005年以來,國際醫學期刊編輯委員會實施了一項政策,要求將臨床試驗注冊作為發表的先決條件。11此外,自2007年起,fda要求發起人或其指定人員在ClinicalTrials.gov上注冊試驗並報告關鍵數據元素和基本試驗結果。12因此,ClinicalTrials.gov注冊被認為是全球最全麵的臨床試驗信息來源。13 - 15利用這一廣泛的資源將使我們能夠更深入地了解上市後藥物安全監測。
我們研究的目的是檢查已注冊的IV期臨床試驗在藥物安全性方麵的特征,並確定需要更多關注的領域。我們專注於從臨床試驗中產生可靠證據所需的數據元素,包括樣本量和與使用隨機化和盲法相關的因素。
方法
數據源
我們的分析僅限於2004年至2014年間在ClinicalTrials.gov上注冊的IV期臨床試驗。2015年3月18日,在ClinicalTrials.gov網站上注冊的19 359項IV期臨床研究的數據集被下載並鎖定。為了便於分析,設計了一個數據庫。15,16
研究選擇
兩位作者(XZ和YZ)選擇了符合條件的研究,並獨立地總結了他們的結果。圖1顯示了選擇的完整過程。我們的分析僅限於2004年1月1日至2014年12月31日(n=18 642)之間注冊的IV期臨床試驗(根據提交給ClinicalTrials.gov的第一個日期)。通過在ClinicalTrials.gov網站上搜索“研究類型”和“幹預”兩欄,可以確定使用藥物的介入研究。觀察性研究(n=981)、擴大獲取性研究(n=10)和調查“醫療器械”、“疫苗”或其他產品的其他研究被刪除(n=5878)。在ClinicalTrials.gov網站上,“終點分類”部分指出了研究的主要終點,如生物等效性、藥代動力學、安全性和有效性等。此外,根據“主要目的”部分的信息,研究可以分為不同的組:“治療”、“預防”、“診斷”、“支持性護理”、“篩查”、“衛生服務研究”、“基礎科學”、“教育/谘詢/培訓”和缺失。我們進一步通過“主要目的”和“終點分類”部分確定了目的為“治療”、主要終點為“安全性研究”或“安全性/有效性研究”的研究。最後,4722項評估藥物安全性或安全性和有效性的符合條件的IV期試驗被納入我們的分析。
然後根據不同的臨床專業將納入的試驗分為三組——心理健康、腫瘤和心血管疾病,使用“條件”部分的信息和ClinicalTrials.gov通過匹配每個研究的NCT編號提供的研究分類。beplay体育相关新闻
數據收集
根據ClinicalTrials.gov注冊中心的要求,試驗數據由試驗發起人或研究人員報告。17每個記錄包含一組數據元素,描述研究的條件、注冊、研究設計、資格標準、地點、讚助商和其他協議信息。
前麵已經描述了定義派生變量的方法15,18並簡要概括如下。根據“sponsor_合作者”和“Funded_By”部分的信息,所有試驗按資金來源分為六個不同的組:NIH、行業、其他、美國聯邦(不包括NIH)、大學/學院、醫院和其他來源。如果主要讚助者或合作者來自NIH,則資金來源定義為NIH,而主要讚助者不是來自工業界。它被定義為工業,如果主要發起人來自工業或者如果有合作者來自工業而沒有來自NIH。它被定義為來自美國聯邦資源,如果讚助者僅來自美國聯邦政府,而沒有來自工業界或NIH的合作者。如果主要讚助者來自醫院或類似機構,並且沒有來自工業界、NIH或美國聯邦政府的合作者,則資金來源被定義為“醫院”。如果主要發起人來自大學、學院或類似機構,而合作者不是來自工業界、NIH、美國聯邦機構或醫院,則將其定義為“大學/學院”。對於其餘的研究,資金來源被定義為其他來源。試驗的開始日期可以從“Start_Date”部分獲得。有關任命數據監測委員會(DMC)的信息自2007年4月開始提供,並不是必填字段。18因此,我們的研究沒有考慮DMC信息。其他變量的分類基於ClinicalTrials.gov中相應字段的信息。
當數據字段不完整時,進行網絡搜索(ClinicalTrials.gov)以查找該試驗缺少的信息。如果網站上也沒有該信息,則該字段被標識為NA(不適用)或缺失。對於報告單組幹預模型且組數為1的研究,如果信息缺失,我們推斷分配的值為非隨機的,而盲化的值為開放的。15此外,如果單臂試驗被登記為隨機或盲法,分配或盲法被報告為“不確定”。
統計分析
試驗的特征通過兩個終點分類(僅安全性和安全性/有效性)和三個臨床專業(心理健康、腫瘤和心血管疾病)進行了總體評估。beplay体育相关新闻評估內容包括研究現狀、入學人數、幹預模式、資金來源等。臨床試驗的注冊時間表是通過將ClinicalTrials.gov網站首次收到的日期與試驗開始日期進行比較確定的。
根據二項分布和泊鬆分布,如果不良事件(AEs)發生的概率分別為1%、0.5%或1%,則報名人數應分別大於300、600或3000 (表1),以便研究人員有95%的機會觀察到至少1例ae。19因此,我們將納入的試驗分為五種類型:樣本量<300的試驗,樣本量在300到599之間的試驗,樣本量在600到2999之間的試驗,樣本量在3000或以上的試驗以及缺失的試驗。為分類特征提供了頻率和百分比;提供連續特征的中位數和iqr。
采用Logistic回歸分析評估與隨機化和盲法相關的因素。建立了包含8個特征的完整模型,並計算了這些因素的Wald 95% ci。評估的因素包括資金來源、主要目的、參與者數量、試驗專業(是/否)、2007年FDAAA公布前一年或後一年的試驗開始和終點分類(安全性/療效研究或安全性研究)。沒有任何數據元素的單臂試驗或研究被排除在回歸分析之外。
所有統計分析均使用SAS V.9.2 (SAS Institute)。
結果
從2004年1月1日到2014年12月13日,在ClinicalTrials.gov上注冊了18642項IV期臨床試驗。在這些試驗中,4722項與藥物安全性相關的IV期試驗納入了我們的研究。圖1顯示搜索過程。單獨評估安全性的試驗數量為330個,少於同時評估安全性和有效性的試驗數量(n=4392)。共有594項試驗(12.6%)集中在精神衛生疾病,251項試驗(5.3%)集中在腫beplay体育相关新闻瘤學,601項試驗(12.7%)集中在心血管疾病。
在ClinicalTrials.gov上注冊的4722項試驗的基本特征顯示在表2.每次試驗參與者的中位數為104.0 (IQR: 48.0-258.0)。這些IV期試驗中約72.7%采用隨機分組,44.4%采用盲法(包括雙盲和單盲)。我們還注意到,8.3% (n=391)的這些IV期試驗被“終止”或“撤回”,這意味著這些試驗由於某些原因而停止。4722項研究中的大多數規模較小(中位數:35.5;差:11.0 - -104.3)。這些IV期臨床試驗最常見的研究地點來自北美、亞太和歐洲,分別占34.4%、28.2%和26.5%。
在全部IV期試驗中,僅評估藥物安全性的68.5%的入組患者數<300例,其中隻有3.9% (n=13)入組患者數超過3000例。每次試驗參與者的中位數為104.0 (IQR: 45.0-392.0)。評估安全性和有效性的IV期試驗的平均樣本量相似,中位入組率為103.0 (IQR: 48.00-251.5)。與同時評估安全性和有效性的研究相比,專注於藥物安全性的IV期試驗顯示,使用單組分配的研究比例較大(41.8% vs 25.9%),使用隨機分配的研究比例較小(56.7% vs 74.0%)。然而,僅關注安全性的試驗與評估安全性/有效性的試驗之間使用盲法的研究比例差異相對較小(34.0% vs 42.8%)。
表3顯示了三個主要治療領域(心血管、腫瘤和心理健康)的IV期試驗的特點。beplay体育相关新闻心血管疾病試驗在這三個類別中占最多(n=601, 12.7%)。心血管試驗也有更多的參與(中位數:163;IQR: 70.0-400.0)比腫瘤試驗(中位數:100.0;IQR: 48.0-200.0)和心理健康beplay体育相关新闻試驗(中位數:88.0;差:40.0 - -226.0)。與心血管試驗和心理健康試驗相比,腫瘤學試驗中隨機化較少(心血管試驗為43.0%,心理健康試驗為81.4%,心理健康試驗為67.5%)。beplay体育相关新闻使用盲法的差異類似(腫瘤試驗17.5%,心血管試驗46.2%,心理健康試驗57.2%)。beplay体育相关新闻作為僅針對女性的試驗,她們在腫瘤學試驗中占比最大,為13.5%,而在心血管試驗中為1.3%,在心理健康試驗中為2.3%。beplay体育相关新闻值得注意的是,近三分之二的心理健康試驗(65.0%)排除了老年患者。beplay体育相关新闻 Geographical differences were also apparent. Mental health trials had the largest proportion of studies with at least one North American research site (52.9%), whereas, oncology trials showed the largest proportion of studies with at least one Asia and Pacific research site (42.2%). The NIH sponsored more mental health trials (8.9% vs 1.0% for cardiovascular trials and 0.4% for oncology trials).
表4顯示回歸分析的結果。這些分析比較了與使用盲法和隨機化相關的試驗特征。共有1276項單臂試驗和78項數據元素缺失的研究被排除在回歸分析之外。因此,回歸模型中考慮了3361個試驗。在這些試驗中,1950例(58.02%)為盲試驗,3234例(96.22%)為隨機試驗。不同的臨床特點會影響盲法和隨機法的使用。腫瘤學試驗不太可能同時使用兩種盲法(調整後OR: 0.33;95% CI 0.18 ~ 0.63)和隨機化(調整後OR: 0.42;95% CI 0.28 ~ 0.63)。beplay体育相关新闻心理健康試驗更有可能實施盲法(調整後OR: 3.35; 95% CI 2.56 to 4.38). Compared with the trials in which industry was the lead sponsor, the trials funded by universities or similar institutions were more likely to use blinding (adjusted OR: 1.32; 95% CI 1.08 to 1.60).
討論
本研究對目前評估藥物安全性的IV期臨床試驗進行了描述性評估。比較不同終點分類和臨床特點的IV期臨床試驗的特點。我們還分析了與試驗質量相關的因素。因此,這項研究提供了一個獨特的機會來評估與藥物安全性相關的IV期試驗的前景,並確定相對優勢或弱點的領域。
樣本量小是涉及已批準藥物安全性監測的IV期試驗中最大的問題。小型IV期臨床試驗可能用於評估特定藥物在特定患者亞組或特殊情況下的有效性。5然而,我們的研究隻納入了以“安全性”為終點的IV期試驗,其中大多數試驗(77.6%)的入組人數<300人。在以安全性為主要終點的IV期試驗中,平均樣本量僅為104例。因此,這些小型試驗可能沒有足夠的能力來檢測ae,特別是不太常見的ae。19更多地關注IV期試驗的質量可能有助於上市後藥物安全監測。對於以安全性評價為主要目的的試驗,應根據每個AE預期發生的概率估計樣本量。例如,為了觀察一個發生概率為1.5%的AE,中國食品藥品監督管理總局要求以藥物安全性為重點的IV期試驗報名人數應在2000個以上。20.對於同時評價療效和安全性的IV期臨床試驗,樣本量應分別根據療效和安全性的效應量計算,以較大的效應量確定研究規模。
IV期臨床試驗可以有不同的設計,可以接受單臂、非隨機或開放標簽研究。如果隨機和盲法在對照組的研究中是可行的,它們可以減少偏倚,使證據更加可靠。在有對照的IV期臨床試驗中,與由工業界讚助的IV期臨床試驗相比,由大學或學院讚助的試驗更有可能使用盲法。試驗的方法學差異在不同的治療領域也很明顯。腫瘤學試驗不太可能使用隨機和盲法,這與以前的研究結果一致。15一個可能的原因是,一些腫瘤學試驗是為了研究個體化或個性化治療,隨機或盲法是不可行的。由於ClinicalTrials.gov上的信息有限,很難檢查是否所有有對照的IV期試驗都是適當設計的。然而,研究人員應該在可行的情況下采用隨機和盲法。
與之前評估臨床試驗總體質量的分析相比,15我們的研究結果顯示了一些有趣的發現。一是亞太地區在四期臨床試驗中發揮更大作用。在IV期臨床試驗中,包括亞太地區在內的30.5%的臨床試驗較所有臨床試驗的前期分析有顯著改善(13.5%)。15納入不同的人群可以提供更多的信息,並幫助臨床醫生確保或改進已批準藥物的安全性。其次,IV期臨床試驗終止或撤回的比例相對較高(8.6%)。卡利夫的等15研究顯示,從2007年10月到2010年9月注冊的所有介入臨床試驗中有3.3%被終止或撤回。我們進一步分析了終止或退出的IV期臨床試驗的條件、終點和位置,但除了規模小之外,沒有發現任何特殊特征(中位數:38.0;差:12.0 - -116.5)。第三,第四階段試驗的最大比例是由工業界資助的。製藥行業可以利用第四階段試驗來擴大批準藥物的標簽,或者尋找一個全新的適應症,這可能是眾多小型第四階段試驗的一個潛在解釋。然而,與藥物處方和使用相關的風險的識別和描述也是必要的,並且應該基於適當的設計和足夠大的樣本量。
本研究存在一些不可避免的局限性。首先,一些臨床試驗沒有在ClinicalTrials.gov注冊表中注冊,這些研究沒有包括在我們的分析中。然而,ClinicalTrials.gov仍占世界衛生組織門戶網站所有臨床研究的80%以上,15所以我們的分析具有廣泛的代表性。其次,某些數據字段缺少數據,這可能會對結果產生一些偏差。第三,如“方法”部分所述,我們使用ClinicalTrials.gov注冊表中的終點分類字段來識別與藥物安全性相關的IV期試驗;然而,我們沒有進行額外的人工篩選,以確定評估安全性和有效性試驗的主要終點。
結論
我們發現,在ClinicalTrials.gov網站上,與藥物安全相關的IV期試驗企業以小型試驗為主,質量存在顯著異質性。這些發現對IV期臨床試驗是否有能力為安全用藥提供足夠數量的高質量證據提出了質疑。以安全性為主要終點的IV期試驗應強調足夠的樣本量。
致謝
作者對審稿人提出的寶貴修改意見表示感謝。作者還感謝陸堅博士在設計這項研究時的幫助。作者感謝Meijing Wu和American Journal Experts, LLC的專業編輯服務。
參考文獻
腳注
XZ和YZ貢獻相同。
貢獻者XZ和YZ在構思這個項目、促成協議、分析數據和起草這份手稿方麵貢獻均等。XY領導了基於績效激勵的發展,並對手稿進行了批判性的修改。TZ和XG花了時間和精力來修改方案。JH為研究的總體設計提供了專業知識,並對手稿進行了修改和批準。
資金本研究由國家自然科學基金項目(編號:81502895,81373105)、上海市循證公共衛生建設重點學科(編號:12GWZX0602)和“公共衛生學科與人才計劃第四個三年行動計劃:循證公共衛生與衛生經濟學”(編號:15GWZK0901)資助。
相互競爭的利益沒有宣布。
出處和同行評審不是委托;外部同行評審。
數據共享聲明分析數據集在Datadryad.org網站上進行了升級。在這次修訂中使用的數據集的標題是“2004年至2014年由ClinicalTrials.gov接收的IV期臨床研究”。URL:http://datadryad.org/review?doi=doi:10.5061/dryad.3t6sc.