條文本
摘要
客觀的2組隨機對照試驗(RCT)的統計分析通常采用傳統的分析方法(如協方差分析(ANCOVA)、縱向數據分析(LDA))。“約束”縱向數據分析(cLDA)是一種成熟的無條件技術,它約束各組間的基線方法相等。我們對來自集團醫療診所(GMC)糖尿病患者的縱向隨機對照研究的空腹血脂譜進行分析,以說明ANCOVA、LDA和cLDA的應用,以證明這些方法的理論概念,包括數據缺失的影響。
方法對於所示示例的分析,所有模型都使用線性混合模型擬合到隻有完整數據的參與者和使用所有可用數據的參與者。
結果根據完整的數據(n=195), 95% CI覆蓋率相當於ANCOVA和cLDA,估計為11.2 mg/dL (95% CI為−19.2至−3.3;p=0.006)與常規治療組相比,GMC組的平均低密度脂蛋白(LDL)膽固醇更低。根據所有可用數據(n=233),應用cLDA模型可使LDL改善8.9 mg/dL (95% CI為−16.7至−1.0;p=0.03)。低效率的LDA分析結果顯示LDL改善7.2 mg/dL (95% CI−17.2至2.8;p=0.15)。
結論在合理的缺失數據假設下,cLDA將產生有效的治療效果估計和穩健的推理統計。可以認為這是一種優於ANCOVA和LDA的方法。
- 約束縱向數據分析
- ANCOVA
- 縱向個隨機對照試驗
這是一篇開放獲取文章,根據創作共用屬性非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此作品的基礎上進行構建,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
數據來自Altmetric.com
本研究的優勢和局限性
有必要澄清縱向隨機對照試驗(rct)可用的統計方法以及分析建議。
在許多縱向rct中,參與者在基線時進行測量,然後在相同的隨訪場合進行少量隨訪,例如2-4次。在這個設計中,基線值應該如何處理?
在實際應用中,有約束的縱向數據分析,即協方差分析的適當推廣,是最直接實現的,在合理的缺失數據假設下,將產生治療效果差異的穩健估計和有效的推斷統計。
介紹
在最近的一項縱向隨機對照試驗(RCT)中,旨在檢查團體醫療診所(GMC)對糖尿病患者心血管結局的影響,GMC幹預對低密度脂蛋白(LDL)水平影響的統計推斷取決於所采用的分析方法。1根據所使用的分析方法,治療組之間LDL的平均差異估計範圍為6.9至11.2 mg/dL。審稿人對主要分析方法提出了質疑,即GMC組與常規治療組相比LDL改善了8.9 mg/dL (p=0.03),並要求另一種看似合理但不太有效的分析方法,即GMC組與常規治療組相比LDL改善了7.2 mg/dL (p=0.15)。因此,幹預效果的解釋因所使用的分析技術而有顯著差異。基於這一經驗和其他類似性質的經驗,澄清可用的方法和分析建議是有必要的,不僅對統計分析人員有用,對評估縱向rct的臨床研究人員也有用。
縱向研究設計
在許多縱向rct中,研究參與者在相同的隨訪測量場合被測量,隨訪場合的數量較少,例如2-4個。通常,在隨機分組之前測量基線結果。在分析中,基線結果可被忽略,用於計算變化評分,有條件地用作協變量,或可作為結果響應向量的一部分。在這個設計中,基線值應該如何處理?利益的問題是有條件的嗎,考慮到一個人的基線不同治療組之間的結果有什麼不同,還是無條件的,改變中的治療差異是什麼?或者這有關係嗎?這些基本問題及其對分析方法的影響在50多年前Lord的一篇前哨論文中介紹過2隨後就產生了“洛德悖論”這個詞。在Lord的假設例子中,條件問題和無條件問題之間的差異,以及如何應用分析,在應用於相同的數據集時,產生了不同的答案和統計推斷。盡管有大量的文獻3 - 8對於這類數據,關於縱向統計分析的生物醫學研究應用仍然缺乏清晰度。
正如本文所討論的問題,在縱向隨機對照試驗的分析策略中需要考慮的一個主要並發症是數據缺失。損耗(輟學率)或間歇性缺失甚至發生在我們正在處理的很少測量場合的研究中。減少隨機對照試驗中缺失數據的數量可以提高結果的可靠性;9然而,幾乎不可能完全消除缺失的數據?在縱向隨機對照研究中分析“變化”時,用於處理缺失數據的假設和方法會極大地影響結果的穩健性、有效性和說服力,需要清楚地理解。
在縱向隨機對照研究的統計文獻中,普遍的共識是,有條件的方法,即協方差分析(ANCOVA)是最強大和穩健的方法4,8解決基本的利益問題。我們采取這一觀點,並詳細闡述了其實施,考慮到缺失數據的額外複雜性,並列舉了無條件約束縱向數據分析(cLDA)模型的好處,說明它們在縱向試驗的設置中推廣了ANCOVA方法。
分析策略
在此處所述類型的縱向隨機對照試驗中,在所定義的每個試驗評估期(試驗每個組的每個參與者)測量相關結果。在此設置中,將結果定義為 ,每個時間點的評估值,t對於每個個體I ( 。最簡單的形式是,縱向隨機對照研究是一種前/後類型的研究,在兩個時間點進行評估,一個是治療前基線, ,一次後處理, 。
在具有多個但較少隨訪時間點的更一般的縱向隨機對照研究設計中,響應剖麵建模6也稱為混合模式重複措施10通常使用,因為它允許隨時間變化的平均響應的任意模式(即,時間為虛擬編碼)以及響應的協方差,並可用於擬合ANCOVA, cLDA或縱向數據分析(LDA)模型。從建模的角度來看,治療前基線評估既可以被視為治療後結果的固定預測因子,也可以被視為結果評估。對於前者,有條件的ANCOVA方法根據觀察到的基線值得出治療差異隨時間的估計,其中治療後結果測量是響應變量。對於後者,無條件模型(LDA或cLDA)無條件地產生治療差異的估計,在縱向隨機對照研究中,治療前和治療後的結果測量都是響應變量。
條件模型與無條件模型
條件分析和無條件分析之間的根本區別在於預處理評估的建模。在無條件分析中,基線是響應向量的一部分,需要額外的假設來建模基線。在LDA中,基線上沒有建模約束;假設不同的基線均值適合每個隨機分組。LDA中用於治療差異隨時間變化的一般測試相當於變化評分類型的分析;比較各組間從基線到隨訪的變化。相比之下,cLDA的基線均值在隨機分組之間被限製為相等;假設一個共同的基線平均值,並適用於隨機分組。在隨機對照試驗中,基線在任何治療結束之前,在預期下,基線均值相等。當沒有結果數據缺失時,cLDA中治療差異隨時間變化的測試本質上等同於ANCOVA中治療差異的測試。5,11 - 13
有條件的模型
在兩臂(j= 1,2)隨機對照試驗(RCT)中,采用前/後設計的ANCOVA模型將在基線和一次隨訪時間(t=0,1)進行研究結果測量。但是,每個參與者隻有一個響應變量(i=1,…,n)j)作為基線(Y0)是模型中的協變量。該模型寫為: 1
隨訪時間的邊際平均值(t=1)取決於基線 。的參數 是基線的斜率,和 在時間(t=1)與治療(j=1)相比,治療(j=2)的效果是否根據基線效應進行了調整。
無條件的模型
LDA模型
在兩臂(j= 1,2)隨機對照試驗中,采用前/後設計的LDA模型在基線和隨訪時間都有研究結果測量(t=0,1)。該模型寫為: 2
參數γ是各組之間在時間(t=0)時的基線平均值的差值,τ是各組從基線到隨訪的平均變化差值(j=1), δ是各組之間從基線到隨訪的變化差值。
cLDA模型
采用前後設計的兩臂(j= 1,2) RCT中的cLDA模型在基線和隨訪時間都有研究結果測量(t=0,1)。該模型寫為: 3.
的參數 為各組從基線到隨訪時間結局的平均變化(j=1), δ′為各組從基線到隨訪時間結局變化的平均差值,然而,由於假定基線均值相等,因此為各組隨訪時間結局的平均差值。
條件模型和無條件模型比較
無缺失基線或隨訪數據:當基線或隨訪數據不缺失時,Liang和Zeger5和劉等11已經表明,ANCOVA和cLDA模型對治療差異產生了相同的點估計。使用我們的模型符號,我們可以在沒有丟失基線或後續數據的情況下聲明: 4
同樣,對於合理規模的試驗,ANCOVA和cLDA模型之間的治療效果差異的方差將大致相等(見在線補充附件一個)。
弗裏森和波科克3.表明與ANCOVA或治療後均值的估計治療差異或LDA模型中與基線的變化具有相同的期望值。然而,從基線分析來看,他們證明了ANCOVA的推理能力普遍優於POST和CHANGE。的方差估計方程可以看出圖1在前後測量之間的相關性範圍內,ANCOVA和cLDA優於LDA-POST和LDA-CHANGE補充附錄A方差估計)。對於測量前和測量後之間的高相關性,LDA-CHANGE和ANCOVA/cLDA的方差相似。
上麵描述的條件和無條件模型很容易從隻有一個隨訪時間點的前後型設計擴展到多個隨訪時間點,通過添加虛擬變量來表示隨訪時間。同樣,對前後設計的模型和估計的比較也適用於後續時間點。在測量次數較少的縱向隨機對照試驗中,感興趣的比較通常是最後一個隨訪時間點(T)的治療差異——上述關於前後設計中後時間測量的理論適用於分析治療組在任何特定隨訪時間的差異。
激勵的例子:團體醫療診所研究
我們對糖尿病患者的GMC縱向隨機對照試驗的空腹血脂譜進行了分析,以說明ANCOVA、LDA和cLDA模型的應用,並演示了上述理論概念,包括數據缺失的影響。1該研究將239名參與者按3:2的比例隨機分為GMC組(n=133)和常規護理組(n=106)。空腹血脂譜是GMC研究的次要結果,在基線、中點(中位隨訪6.8個月)和研究結束(中位隨訪12.8個月)測量。14
為了說明,我們重點分析基線和12個月的LDL膽固醇(LDL- c)測量結果。為便於標記,GMC用j=G表示,常規護理用j=U表示,基線用t=0表示,12個月用t=12表示。所有分析均采用SAS V.9.2 (SAS研究所,Cary, North Carolina, USA)。
方法
為了分析方法的完整性,除了ANCOVA、LDA和cLDA模型外,我們還進行了簡單post only (SPO)和簡單變化評分分析(SACS)。對於SPO,我們比較了平均12個月LDL-C ( ), GMC (j=G)表示常規護理(j=U) 12個月LDL-C ( 對於SACS,我們比較了自基線以來的平均LDL-C變化( )到基線LDL-C的平均變化(j=G) )用於常規護理(j=U),使用兩樣本t檢驗。然後應用ANCOVA、LDA-CHANGE和cLDA模型, 而且 為LDL-C評估值。三種模型均采用線性混合模型擬合15以及響應剖麵建模方法。模型擬合采用PROC MIXED,限製極大似然估計和非結構化協方差。
死亡者分析
第一組分析應用於同時進行基線和12個月測量的參與者(完成者),以證明模型的理論比較,如所述,沒有數據缺失的額外複雜性。
結果
在研究中隨機抽取的239名患者中,195名參與者在基線和12個月時進行了LDL-C測量。所有方法在兩組間LDL-C的差異均有統計學意義(表1),采用變化評分分析方法(SACS和LDA), p=0.05。SPO在GMC和常規護理之間的平均LDL-C估計差異最大。正如預期的那樣,ANCOVA和cLDA在12個月時的估計平均治療差異和95% CI覆蓋率是相等的,與常規治療相比,GMC的估計平均LDL-C降低了11.2 mg/dL。與常規護理相比,SACS和LDA估計差異和95% CI覆蓋率相等,GMC的基線和12個月平均LDL-C之間估計降低10.1 mg/dL。LDA和SACS分析比ANCOVA和cLDA方法產生更寬的95% CI。對於完井作業,ANCOVA和cLDA得到了最可靠的結果,並說明了它們的優越性(如圖所示)圖1)和變化評分方法(包括SACS和LDA),因為基線和12個月LDL-C值的相關性估計在0.50範圍內。
結果
在隨機分組的239例患者中,6例患者沒有基線或12個月LDL-C,因此將他們排除在外,產生233例患者用於所有參與者分析。不同分析方法估計的治療差異存在差異,使用α=0.05 (表2).ANCOVA和SACS相當於完成者分析,因為刪除了38例基線缺失或12個月LDL-C的病例。ANCOVA和cLDA方法對治療差異的估計不再相同。所有233名參與者至少為cLDA分析提供了一項測量值,因此與常規治療相比,GMC患者12個月時平均LDL-C降低8.9 mg/dL表2).ANCOVA和cLDA之間估計治療差異的差異是由於缺失數據和對缺失數據所做的假設。如前所述,混合效應模型在假設缺失數據以觀測量為條件的情況下對治療效果產生無偏估計。雖然這一假設無法具體驗證,但ANCOVA和cLDA模型之間的估計差異產生了一些證據,表明數據缺失是基於觀測量的。如果數據完全隨機缺失(不以觀察到的數量為條件),則刪除病例的ANCOVA和cLDA之間的估計治療差異應該相似。同樣,僅完成者與使用所有可用數據的參與者之間,僅post模型和LDA模型的估計差異提供了證據,表明缺少觀察值的參與者可能不是研究人群中的完全隨機樣本。因此,任何僅基於完井器的分析(包括ANCOVA模型)都可能存在偏差。
如ANCOVA和cLDA所示,LDA和SACS方法估計的差異是由於缺失數據和對缺失數據所做的假設造成的差異。LDA使用所有可用數據並使用混合效應模型進行擬合,而在SACS中,缺失數據的參與者被刪除。與完井分析類似,LDA方法的95%置信區間比cLDA和ANCOVA方法都要寬。
討論
缺失的數據含義:cLDA的案例
上麵給出的說明性示例清楚地演示了分析方法所描述的統計理論和缺失數據的影響3.,4,16關於結果的推斷和解釋。一般來說,在試驗中如何處理缺失數據的影響範圍從樣本量和統計功率損失到對治療效果的潛在偏向估計。奧爾森等18討論處理與我們正在討論的縱向隨機對照試驗類型相關的睡眠障礙縱向試驗中缺失數據的原則方法。在許多軟件包中,處理缺失數據的默認方法是刪除大小寫;如果參與者缺少任何變量或結果,則從分析中刪除該參與者。為了在病例刪除發生時對治療效果差異的估計是無偏的,我們必須假設具有完整數據的參與者子集是整個研究樣本的隨機樣本。因此,對於上麵的ANCOVA、SACS和SPO分析,我們都做了這樣的假設。對於許多縱向隨機對照試驗來說,退出的概率可能與一些可觀察到的特征或數量有關(例如,治療臂分配),因此擁有完整數據的參與者子集並不是整個研究的隨機樣本。在此假設下,可以通過混合效應模型或執行多重imputation實現對治療效果的無偏估計。18當我們不能假設缺失數據可以用可觀察量來描述時,處理缺失數據的方法超出了本文的範圍。
是否使用多重歸責的選擇取決於分析人員,並基於不可測試的假設,即所有缺失數據的預測因子都可以包含在混合效應模型中。在許多縱向隨機對照試驗中,合理的假設是治療組分配、評估時間和可用的結果評估以及潛在的基線分層變量將是缺失結果數據的預測因素。如果缺失數據的潛在預測變量的數量很大,不合理地包括在混合效應模型中,那麼可能有必要進行多重imputation分析。
多重imputation是處理缺失數據的一個更複雜的過程,它也是基於不可測試的假設,即缺失數據的所有預測因子都包含在imputation模型中。17在多重imputation框架中,條件模型和無條件模型的比較將等效於上麵討論的沒有丟失基線或後續數據。一旦創建了估算數據集,就不會缺少結果數據;估算估算值的不確定性在SE估計中得到了解釋。
為了便於執行和結果的健壯性15,16具有最大似然估計的混合效應模型是處理缺失數據的良好首選。即使在應用混合效應模型時,基線值的處理也會因為案例刪除的差異而影響結果。在前/後設計中,如果基線是協變量(ANCOVA),缺少協變量的參與者將被刪除。同樣,隻有一次隨訪時間,如果隨訪時間缺失,則沒有納入參與者的結果數據。然而,在無條件模型中,由於基線和隨訪都是結果向量的一部分,如果參與者缺少任何一項測量,他們的可用數據將被包括在內,參與者不會被刪除。當數據缺失並使用混合效應模型時,在合理假設缺失數據與可觀察特征相關的情況下,cLDA模型是提供治療差異最精確估計的最佳選擇。最後,還應該注意的是,這些方法不會適用於它們可能應用的每個數據集——然而,由於某些缺失的數據假設無法具體測試,cLDA模型是在一係列條件和數據集上的最佳選擇。
總結
cLDA通常可被視為很少測量場合的縱向RCT分析的選擇方法,這似乎沒有得到廣泛的認可。除小樣本外,它等價於無缺失數據時的ANCOVA, cLDA是在合理缺失數據假設下對ANCOVA的適當推廣。毫無疑問,治療組之間潛在的基線不平衡對縱向隨機對照試驗的分析有影響,是混淆的來源。在RCT中,基線差異可歸因於隨機機會,假設隨機化過程沒有問題或問題,也沒有顯著的測量誤差問題。LDA或CHANGE分數分析有時被視為更直觀的分析;然而,對於隨機對照試驗來說,就偏差、精密度和功率而言,最好的方法通常是ANCOVA。19在縱向隨機對照試驗中,當參與者內部相關性不高時,變化分數或LDA(無條件分析)不是最有力的分析。弗裏森和波科克3.發現在測量誤差占參與者間方差的比例較小的假設下,ANCOVA治療差異估計具有較小的偏差;然而,偏差在變化評分分析可能有點大,特別是如果測量前和測量後之間的相關性很小。
當兩個治療組之間的結果基線不平衡時,cLDA有時被錯誤地視為更有問題。但是,在分析完整數據時,cLDA和ANCOVA是等效的。cLDA推廣了ANCOVA方法,在許多情況下兩者都優於LDA。因此,主要的分析問題不一定是是否進行條件分析。ANCOVA是一種條件分析,cLDA是一種無條件分析,但兩者都是強大的方法,可用於縱向隨機對照研究中隨時間變化的治療差異。在實際應用中,cLDA是最直接實現的,在合理的缺失數據假設下,將產生治療效果差異和推斷統計的穩健估計。在大多數情況下,這是選擇的方法。
參考文獻
腳注
貢獻者主要作者是達勒姆VA衛生服務研究與發展小組生物統計部門的高級統計學家,杜克大學醫學中心生物統計和生物信息係副教授。所有列出的作者都對手稿的設計和準備做出了貢獻(CJC, DE和RFW)。所有數據分析均由CJC進行。
資金這項研究由美國退伍軍人事務部衛生服務研究與發展服務IIR 03-084資助。
相互競爭的利益沒有宣布。
出處和同行評審不是委托;外部同行評審。
數據共享聲明沒有其他數據可用。