條文本

下載PDF

研究與zero-inflated抑鬱影響因素回歸模型的大規模人口調查
  1. 徐道1,
  2. Guangjin朱2,
  3. Shaomei漢1
  1. 1流行病學和統計數據,基本醫療科學研究所、中國醫學科學院&基本醫學學院,北京協和醫學院,北京,中國
  2. 2的生理病理學,基本醫療科學研究所、中國醫學科學院&基本醫學學院,北京協和醫學院,北京,中國
  1. 對應到教授Shaomei漢;hansm1在}{vip.sina.com

文摘

目標抑鬱症狀的數量可以被認為是為了得到完整、準確統計數據分析發現抑鬱症的研究中。本研究旨在比較四個計數結果模型的擬合優度的大型調查樣本識別風險因素的最優模型研究抑鬱症狀的數量。

方法15 820例,年齡在10到80歲不患有嚴重的慢性疾病和沒有運行一個高燒在過去15天,同意參與這個調查;15 462名受試者完成所有調查量表。抑鬱症狀的數量之和"正麵"七抑鬱問題的反應。四個計數結果模型和邏輯模型建立了確定最優模型的抑鬱症狀的數量。

結果抑鬱症狀的平均數是1.37±1.55。over-dispersion測試統計O是308.011。阿爾法色散參數為0.475 (95% CI 0.443 - 0.508),這是明顯大於0。Vuong測試統計Z是6.782,P值< 0.001,表明有太多零數量占與傳統的負二項分布。zero-inflated負二項(ZINB)模型的最大最小日誌可能性和AIC和BIC建議最好的擬合優度。此外,許多重要的預測概率ZINB模型上觀察計數最好。

結論所有配件測試統計和預測概率曲線產生相同的發現ZINB模型是最好的模型擬合抑鬱症狀的數量,評估抑鬱症的存在與否及其嚴重性。

  • 抑鬱症
  • 計數數據
  • 在分散
  • zero-inflated
  • 泊鬆回歸
  • 負二項回歸

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 本研究探討的方法構建泊鬆、NB、ZIP和ZINB模型對抑鬱症狀的數量和比較了回歸模型擬合的四個計數結果。

  • 阿爾法色散參數,測試和Vuong測試顯示over-dispersion和過度0對抑鬱症狀的數量。

  • 似然比統計量和預測概率曲線表明ZINB模型是最好的模型擬合抑鬱症狀的數量。

  • ZINB模型可以提供更準確的信息風險因素抑鬱狀態模型比其他物流模型和計算結果。

  • 並對它們進行分類計數數據將導致損失的一些有用的信息;因此,邏輯回歸並沒有適當的模型計算結果研究。

介紹

在統計,統計數據是一個類型的數據的觀察隻能采取非負整數的值{0、1、2、3、…},和這些整數源自計數,而不是排名。1計數數據是常見的在醫學研究中,如抑鬱症狀的數量、齲齒、不良事件的臨床試驗,身體活動的日子,等等。在統計處理,他們通常認為是連續的結果或轉移到兩個數據。然而,被當作連續的數據,統計數據往往是非常具體的,不遵循正態分布。因此,算術平均值和標準偏差不適用的統計數據,並因此線性回歸是不適當的分析方法由於偏態分布和over-dispersion。此外,統計數據不同於兩個數據,在觀察隻能取兩個值,通常由0和1表示。統計數據的分類用於原油率和邏輯回歸將會導致信息丟失。此外計數數據不同於順序數據,也可以包含整數,但個人的價值觀隻落在任意規模和相對排名是很重要的。因此,治療數數據作為連續變量線性回歸或二分變量邏輯回歸模型可能偏見的結果。2 3

針對這些局限性,泊鬆回歸或負二項回歸(NB)是常用的模型計算結果假設泊鬆分布或負二項分布是適用的分布。但基於泊鬆分布的概率0或負二項分布不能占多餘的零計數。忽略多餘的零偏差參數的估計。4Zero-inflated(子)回歸模型考慮原始數據集的混合0子集和另一個子集遵循泊鬆分布或負二項分布。子模式迄今為止最好的模型來解決這一問題與多餘的零。5 - 15

抑鬱通常是評估尺度,指抑鬱症狀的數量和嚴重性。一般來說,參與者將會分為兩個或幾個類別根據他們積極的抑鬱症狀條目。流行率和邏輯回歸是用來研究入射強度和抑鬱症的危險因素。16 - 20這些傳統的分析方法很容易丟失信息,因為每個抑鬱的主題可能有不同數量的抑鬱症狀,導致無法評估抑鬱症的嚴重程度。本研究旨在比較幾個計數結果的擬合優度models-Poisson模型,NB模型,zero-inflated泊鬆(ZIP)模型和zero-inflated負二項(ZINB)照管模式大規模橫斷麵樣本確定最優模型研究抑鬱症的症狀。

方法

樣品和參與者

大規模人口調查樣本的部分對中國受試者的生理和心理的常數,支持的基本性能關鍵項目的科學技術部中華人民共和國。這個調查雲南省中國西南和兩階段整群抽樣方法。首先,兩個城市被采樣,然後幾個在城市社區和村莊被隨機選擇。在這些選定的社區和村莊,所有符合條件的人被稱為我們的調查受試者年齡在10到80歲,沒有遭受嚴重的慢性病,沒有運行一個高燒在過去15天。所有受試者簽署知情同意表格。審查委員會批準的這項研究是基本醫療科學研究所,中國醫學科學院(倫理批準號005 - 2008)。

抑鬱評估

訓練有素的醫務人員進行調查和訪談。在調查之前,他們被訓練的抑鬱評估量表。抑鬱評定量表設計基於複合性國際診斷訪談短形式的抑鬱症(CIDI-SFMD)。21日22受試者被要求如果有一段時間在他們感到難過的時候,藍色或抑鬱連續2周或更多的在過去的12個月。七個問題被問及他們是否事情失去了興趣,感到疲倦或低能量,得到或者失去體重,比平時更有入睡困難或集中,想了很多關於死亡和感覺自己一無所用。抑鬱症狀的數量的總和"正麵"反應這七個抑鬱症的問題(範圍鹿),這是主要的測量結果。

抑鬱症狀的潛在風險因素模型包括年齡、性別、高血壓狀況、職業、吸煙、飲酒、國籍、婚姻狀況、肥胖、壓力在工作或家庭,積極或消極生活事件。負麵的事件包括失去工作、退休、農作物損失/商業失敗,家庭的磨合,婚姻分居或離婚,其他主要宗旨衝突、重大人身傷害或疾病,暴力,死亡的配偶,死亡/重大疾病的另一個親密的家庭成員或其他主要壓力。一個家庭成員的積極事件的婚禮,新工作或家庭中出生。

分析方法

泊鬆回歸,NB回歸,壓縮模型和ZINB模型構造,其擬合優度比較。這四個模型用於計算的結果。子模型第一次被引入的蘭伯特占多餘的零計數。23張提到子回歸模型可以解釋為計算兩步回歸。4初科目不處於危險之中,所以他們計數為零。協變量的影響可能移動到高危人群和結果遵循泊鬆或NB回歸分布。協變量可能會或可能不會有相同的影響結果分布在兩個步驟。4

子模型是兩部分的模型,包括二進製和計數模型部分為了占多餘的零計數。24壓縮模式指原始數據集作為一個混合物包括零子集和遵循泊鬆分布的一個子集。23郵政模型假設:

嵌入式圖像

同時,ZINB模式指原始數據集作為一個混合物包括零子集和一個子集NB分布。24ZINB模型的概率密度函數是:

嵌入式圖像

Ln和分對數函數被用於參數μ和鏈接嵌入式圖像 嵌入式圖像 。在分對數部分,回歸係數的解釋類似於那些在邏輯回歸。在泊鬆或注部分,傳統的解釋是一樣的泊鬆或NB回歸模型。

在這項研究中,使用SAS 9.2版本的回歸模型建設。阿爾法和色散參數O測試被用來識別over-dispersion。25Vuong測試進行判斷是否有過度的零計數。24日26日回歸模型的擬合善取決於每個數的預測概率曲線,似然比檢驗和統計:對數似、AIC (Akaike信息準則)和BIC(貝葉斯信息準則)。邏輯回歸模型也進行了。

結果

總共15 820名受試者同意參與這個調查,其中的15 462名受試者完成所有調查量表。響應率為97.7%。平均年齡為26.7±16.7年(範圍10 - 80年)。其他特征的示例所示表1:57.31%的受訪者是女性;大約四分之一的受訪者彝族民族;8.8%的受訪者覺得心理壓力在工作或家庭;積極和消極生活事件據報道4.17%和21.17%的受訪者,分別。

表1

受訪者的特點

第二列的表2介紹了觀察抑鬱症狀的數量分布。共有15 462名受訪者中,39.28%沒有抑鬱症狀。更多的症狀意味著較低比例的受訪者。抑鬱症狀的平均數是1.37±1.55。方差大於均值。over-dispersion測試統計O是308.011,P值< 0.001。此外,αα的色散參數為0.475,95%可信區間為0.443至0.508,這是明顯大於0。因此over-dispersed抑鬱症狀的數量。Vuong測試統計Z6.782,P值< 0.001,表明有太多零數量占與傳統的負二項分布。表3展示了四個回歸模型的擬合善。ZINB模型最大的日誌和可能性最小的AIC和BIC,建議最好的擬合優度。泊鬆回歸模型擬合數據最差。

表2

比例和概率預測的數量(%)

表3

合適的統計回歸模型

最後四列表2提出了為每個數在四個回歸模型預測概率。圖1顯示了四個回歸模型的預測概率分布曲線,觀察到的比例。從表2圖1,很明顯,泊鬆回歸模型擬合最糟糕的情況下,每個數的預測概率明顯不同於觀察到的比例。NB模型是一個小比泊鬆模型。郵政和ZINB模型更適合這個數據的預測概率為零計算兩個子模型非常接近觀察到的比例,特別是在ZINB模型。除了2是一個小的預測概率大於觀察計數,ZINB中的其他項的概率模型上觀察到的數量很好。然而,郵政的模型預測少1 s, 2 s和3 s。

圖1

四個模型的預測概率。ZINB, zero-inflated負二項模型;郵政,zero-inflated泊鬆模型。

基於α色散參數,over-dispersionO測試、Vuong測試擬合善統計和預測概率,ZINB模型是最優擬合模型抑鬱症狀的數量。

ZINB模型的回歸係數所示表4。分對數部分表的左邊隻有數為零。很明顯,性別、職業、酒精飲酒者,彝族,單身狀態,壓力,積極或消極的事件是否遇到了抑鬱症狀的危險因素。女性受訪者,腦力勞動者,飲酒,彝族,單身,受訪者遭受壓力,受訪者與正麵或負麵事件更抑鬱的風險。負二項部分在右邊顯示年齡、性別、職業、酒精飲酒者,壓力和負麵事件對抑鬱症的嚴重程度有顯著影響。女性受訪者,腦力勞動者,酒精飲酒者,單身,和受訪者遭受壓力或負麵事件報道更多的抑鬱症的症狀。然而,老年人較少的抑鬱症狀。

表4

ZINB回歸係數對抑鬱症狀的數量

表5顯示了邏輯回歸模型係數對抑鬱症的危險因素。年輕女性,年齡、腦力勞動者、飲酒,彝族,單身,喪偶或離異,肥胖、壓力,和正麵或負麵事件的幾率增加報告一個或更多的抑鬱症狀。

表5

邏輯回歸係數對抑鬱症

討論

本研究探討的方法構建泊鬆、NB、ZIP和ZINB模型對抑鬱症狀的數量和比較四個計數結果回歸模型的擬合優度。

Over-dispersion和可怕的偏態分布減少了實用的線性回歸計算結果。傳統的泊鬆回歸和負二項回歸是常見的模型計算結果。然而,嚴格限製方差等於的意思是導致over-dispersed計數數據很難遵循泊鬆分布。伽瑪函數的誤差項,NB允許在分散分布。但過度的零計數對泊鬆回歸和NB有一個壞的影響回歸模型。介紹了子模型為解決過度0。子模型提供了風險因素的評估不僅抑鬱嚴重程度和抑鬱症的存在與否,因為子模型可以在連續體,而不是抑鬱模型這兩個結果。特別是ZINB模型可以解決在分散和過度0在同一時間。

在這項研究中,O測試,Vuong測試、AIC和BIC統計和預測概率曲線表明,ZINB模型是最好的模型對抑鬱症狀的數量約為40%零計數。郵政模型擬合數據比ZINB模型可能因為色散的抑鬱症狀的數量限製的效用壓縮模型。許多研究報告了類似的結果,ZINB模型是最好的模型計算結果。8 12 - 15然而,在身體活動研究,另一個抑鬱症狀的研究中,郵政比ZINB模型被認為是一個更好的模型。27 28

ZINB模型,風險因素對抑鬱的影響可以通過兩個方麵進行評估:是否有抑鬱症,抑鬱症的嚴重程度。邏輯回歸模型報道不同的抑鬱風險因素ZINB模型,特別是對肥胖和喪偶或離異狀態。在ZINB模型中,肥胖和喪偶或離異狀態並沒有發現對抑鬱症狀有強烈影響,盡管P值接近0.05 (P = 0.106, P = 0.068)。此外,年齡隻有抑鬱的嚴重程度和影響不是抑鬱是否在場,和積極生活事件有相反的影響。並對它們進行分類計數數據將導致損失的一些有用的信息,這樣邏輯回歸並沒有適當的模型計算結果研究。

一些局限性值得注意。首先,泊鬆或NB分布假設數量沒有上限。然而,在醫學領域,結果變量可能總是有一個特定的數量上限。在這項研究中,抑鬱症狀的數量範圍從0到7,而不是廣泛傳播。這或許是一個貧窮的原因為傳統的泊鬆回歸擬合優度和NB的回歸模型。第二,一些潛在的風險因素是相互關聯,如壓力和積極或消極生活事件,但沒有太大的相關性有破壞性影響這項研究的結果。

盡管有這些限製,我們可以得出結論,所有配件測試統計和預測概率曲線產生相同的發現ZINB模型是最好的模型擬合抑鬱症狀的數量,不僅評估抑鬱症的存在與否也評估抑鬱症的嚴重程度。

引用

  1. 1。
  2. 2。
  3. 3所示。
  4. 4所示。
  5. 5。
  6. 6。
  7. 7所示。
  8. 8。
  9. 9。
  10. 10。
  11. 11。
  12. 12。
  13. 13。
  14. 14。
  15. 15。
  16. 16。
  17. 17所示。
  18. 18歲。
  19. 19所示。
  20. 20.
  21. 21。
  22. 22。
  23. 23。
  24. 24。
  25. 25。
  26. 26歲。
  27. 27。
  28. 28。

腳注

  • 貢獻者TX負責設計、統計分析和寫作手稿。廣州負責項目設計和實地調查。SH負責設計、數據管理和統計分析。

  • 資金提供的資金是基本性能關鍵項目的科學技術部中華人民共和國(2006號fy110300)。

  • 相互競爭的利益沒有宣布。

  • 倫理批準基本醫療科學研究所的審查委員會,中國醫學科學院。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據共享聲明技術附件,統計代碼,數據集可以從基本醫療科學研究所,中國醫學科學院&基本醫學學院,北京協和醫學院。