文摘
時間序列回歸環境流行病學研究已經廣泛使用,尤其是在調查的短期風險之間的關聯如空氣汙染、天氣變量或花粉、和健康結果如死亡、心肌梗死或特定疾病住院。一般來說,曝光和結果,以固定時間間隔數據(如日常汙染水平和每日死亡率統計),其目的是探索短期之間的關聯。在本文中,我們描述了時間序列數據的總體特征,我們概述分析過程,從描述性分析開始,然後專注於問題的時間序列回歸,不同於其他回歸方法:造型短期存在季節性波動和長期模式,處理時間不同的混雜因素和造型延遲(滯後)接觸和結果之間的聯係。我們完成的建議模型檢查和敏感性分析,和一些常見的基本模型的擴展。
介紹
本文旨在向讀者介紹的方法論的特性和分析問題在環境流行病學研究設計常用的:時間序列回歸研究。設計往往是用於研究試圖量化環境因素的短期協會,如空氣汙染、花粉、塵埃和天氣變量,與健康結果。1 - 3我們的目標是為讀者提供一個了解的一些獨特的特點和挑戰參與分析時間序列數據。希望“消費者”的研究將洞察的方法和使用專業術語的理解在這種背景下,使更有效的批判性思考和評價的研究報告;流行病學家,也可能是在一個位置來分析時間序列數據集將發現這一個有用的教程覆蓋了所涉及的關鍵步驟和重要問題進行時間序列回歸分析。我們的目的是補充其他文章提供曆史視角,比這裏介紹數學建模思想的發展,和覆蓋問題唯一相關的特定風險,如環境溫度和顆粒物質4 - 7(補充附錄中列出的進一步引用可用補充數據在IJE在線)。應該注意的是,雖然我們的重點是時間序列回歸,其他工具分析的時間序列數據存在。在計量經濟學時間序列數據頻繁發生;一些常用的方法在這一領域的目標是預測運動在一個時間序列(如股票市場價格),和流行病學家將有限的興趣,但其他人可以原則上適用於流行病學問題。一個例子是格蘭傑因果檢驗,旨在建立,通過假設檢驗模式,運動在一個時間序列是否有因果聯係到另一個動作。我們不考慮這個或其他方法更常見的進一步相關的計量經濟學。8
在概念和方法將通過一個例子說明基於一個真實的數據集,並占據和R代碼複製我們的分析,以及數據集本身,作為一個可用補充附件在IJE網上。
數據特性和介紹工作的例子
說明性的示例,我們將使用是一個時間序列回歸分析的數據集從倫敦。數據集包含一個觀察每天從1 2002年1月至2006年12月31日,和對於每一天都有一個衡量的(平均)臭氧水平,和總數量的死亡發生在城市。需要解決的問題是“是否有一個協會之間的日常臭氧含量的變化和日常死亡的風險?”,所以感興趣的曝光是臭氧和結果是死亡。數據集還包含日常措施兩個潛在的混雜因素,溫度和相對濕度(混雜在本文後麵討論)。前12行數據所示表1。一些值得注意的特點是:
一般來說,一個“時間序列”僅僅是一個序列的數據點以固定時間間隔記錄。在這個數據集實際上有四個時間序列(臭氧、溫度、相對濕度和死亡人數),目標是說說如果/這些相關聯。
主要分析單元(由一行數據)一天,而不是個人。這將是一個很重要的問題,當我們來考慮潛在的混雜因素可能對我們的分析。但是要注意,時間序列回歸研究並不一定必須在日常水平;每年、每月、每周、甚至每小時時間序列數據可以使用相同的廣泛分析方法論的原則。
結果是一個計數,這是常見的時間序列回歸研究。分母(底層人口規模)不是數據集的一部分,這不是一個問題,因為在這些數據我們通常感興趣的造型變化結果一天比一天或一周一周,和人口規模不太可能改變在這些時間尺度有意義,所以可以安全地忽略的分析。
日期。 | 臭氧(µg / m3)。 | 溫度(°C)。 | 相對濕度(%)。 | n死亡。 |
---|---|---|---|---|
2002年1月1 | 4.59 | −0.2 | 75.7 | 199年 |
2002年1月2 | 4.88 | 0.1 | 77.5 | 231年 |
2002年1月3 | 4.71 | 0.9 | 81.3 | 210年 |
2002年1月4 | 4.14 | 0.5 | 85.4 | 203年 |
2002年1月5 | 2.01 | 4.3 | 93.5 | 224年 |
2002年1月6日 | 2.4 | 7.1 | 96.4 | 198年 |
2002年1月7日 | 4.08 | 5.2 | 93.5 | 180年 |
2002年1月8日 | 3.13 | 3.5 | 81.5 | 188年 |
2002年1月9日 | 2.05 | 3.2 | 88.3 | 168年 |
2002年1月10 | 5.19 | 5.3 | 85.4 | 194年 |
2002年1月11日 | 3.59 | 3.0 | 92.6 | 223年 |
2002年1月12 | 12.87 | 4.8 | 94.2 | 201年 |
日期。 | 臭氧(µg / m3)。 | 溫度(°C)。 | 相對濕度(%)。 | n死亡。 |
---|---|---|---|---|
2002年1月1 | 4.59 | −0.2 | 75.7 | 199年 |
2002年1月2 | 4.88 | 0.1 | 77.5 | 231年 |
2002年1月3 | 4.71 | 0.9 | 81.3 | 210年 |
2002年1月4 | 4.14 | 0.5 | 85.4 | 203年 |
2002年1月5 | 2.01 | 4.3 | 93.5 | 224年 |
2002年1月6日 | 2.4 | 7.1 | 96.4 | 198年 |
2002年1月7日 | 4.08 | 5.2 | 93.5 | 180年 |
2002年1月8日 | 3.13 | 3.5 | 81.5 | 188年 |
2002年1月9日 | 2.05 | 3.2 | 88.3 | 168年 |
2002年1月10 | 5.19 | 5.3 | 85.4 | 194年 |
2002年1月11日 | 3.59 | 3.0 | 92.6 | 223年 |
2002年1月12 | 12.87 | 4.8 | 94.2 | 201年 |
日期。 | 臭氧(µg / m3)。 | 溫度(°C)。 | 相對濕度(%)。 | n死亡。 |
---|---|---|---|---|
2002年1月1 | 4.59 | −0.2 | 75.7 | 199年 |
2002年1月2 | 4.88 | 0.1 | 77.5 | 231年 |
2002年1月3 | 4.71 | 0.9 | 81.3 | 210年 |
2002年1月4 | 4.14 | 0.5 | 85.4 | 203年 |
2002年1月5 | 2.01 | 4.3 | 93.5 | 224年 |
2002年1月6日 | 2.4 | 7.1 | 96.4 | 198年 |
2002年1月7日 | 4.08 | 5.2 | 93.5 | 180年 |
2002年1月8日 | 3.13 | 3.5 | 81.5 | 188年 |
2002年1月9日 | 2.05 | 3.2 | 88.3 | 168年 |
2002年1月10 | 5.19 | 5.3 | 85.4 | 194年 |
2002年1月11日 | 3.59 | 3.0 | 92.6 | 223年 |
2002年1月12 | 12.87 | 4.8 | 94.2 | 201年 |
日期。 | 臭氧(µg / m3)。 | 溫度(°C)。 | 相對濕度(%)。 | n死亡。 |
---|---|---|---|---|
2002年1月1 | 4.59 | −0.2 | 75.7 | 199年 |
2002年1月2 | 4.88 | 0.1 | 77.5 | 231年 |
2002年1月3 | 4.71 | 0.9 | 81.3 | 210年 |
2002年1月4 | 4.14 | 0.5 | 85.4 | 203年 |
2002年1月5 | 2.01 | 4.3 | 93.5 | 224年 |
2002年1月6日 | 2.4 | 7.1 | 96.4 | 198年 |
2002年1月7日 | 4.08 | 5.2 | 93.5 | 180年 |
2002年1月8日 | 3.13 | 3.5 | 81.5 | 188年 |
2002年1月9日 | 2.05 | 3.2 | 88.3 | 168年 |
2002年1月10 | 5.19 | 5.3 | 85.4 | 194年 |
2002年1月11日 | 3.59 | 3.0 | 92.6 | 223年 |
2002年1月12 | 12.87 | 4.8 | 94.2 | 201年 |
描述性分析
第一步應該熟悉流行病學家從所有專業:了解數據通過簡單的圖和表。圖1顯示暴露的散點圖(臭氧)和結果(死亡人數)隨著時間的推移,整個研究期間;這種類型的情節可以很快發現高級模式的數據。移動平均線的情節也可以用來補充原始散點圖和畫出情節模式有效地消除原始數據通過平均固定數量的相鄰原始數據點。在這種情況下,原始圖表明,臭氧濃度和死亡數量似乎都由年度季節性模式,與臭氧在夏季和冬季最低最高,並為死亡相反的模式。注意,通常不會從這個冬天臭氧水平低是造成的死亡率越高:係統模式隨著時間的推移,出現在許多時間序列,誘導的相關性,在大多數情況下不可能代表因果關係。正是因為這一原因,我們的目標是考慮協會在相對較短的時間尺度,更有可能代表真正的因果關係。6
其他信息可能包括描述性分析彙總統計,協變量的相關矩陣是包含在模型和缺失數據的探索。我們的示例數據集不包含缺失值,但經常缺少曝光數據需要處理在初始數據處理或分析本身:刪除不完整的記錄是一個簡單的策略,但會引入偏差;雇傭規則、算法或模型推導出丟失的數據(單獨或乘)的替代品,9但不考慮進一步在這裏。
時間序列回歸
後執行一些初始的描述性分析,下一步是開始建立一個回歸模型(見使用泊鬆回歸分析),將使我們能夠解決我們的主要研究問題。
回歸分析的目的
回歸的主要目的是調查是否一些短期的變化的變化可以解釋的結果主要接觸;在我們的示例中,日常的死亡人數的變化是否解釋部分的空氣中的臭氧水平的變化。回歸方法還允許控製多個潛在的混雜因素。
使用泊鬆回歸分析
這裏的結果變量是計數(每天死亡的人數)。通常的回歸方法分析統計數據的選擇是泊鬆回歸,但是我們需要牢記的一些獨特特性的時間序列數據類型:
在原始數據,長期數據包括季節性可能主導模式(在我們的示例中)。作為我們的興趣是短期的協會,目的是去除這些長期模式(即控製),看看是否感興趣的接觸一些剩餘的短期變化解釋道。可能的策略來控製長期模式是在下一節詳細介紹。
泊鬆回歸的一個假設是違反了原始數據:觀察不可能是獨立的,與觀測接近的時間可能更類似比遙遠的時間(在倫敦的數據集,這是非常明確的圖1)。然而,這種“自動校正”通常不是固有的係列結果,而是由於解釋變量的自相關預測的結果。在控製了季節性、長期模式感興趣的曝光和其他解釋變量,殘差自相關會遠小於原始結果數據,並且通常不是一個大問題。然而,在模型檢查階段它可能是一個好主意專門模型剩餘的自相關和檢查我們的結論不改變(見模型檢查和敏感性分析)。
數據往往是‘overdispersed’,這意味著結果計數高於預測的方差在泊鬆分布(方差=的意思),所以有必要使用一個簡單的調整來獲得適當的標準中的錯誤模型擬合(具體來說,規模應用參數估計的皮爾遜卡方統計量除以剩餘自由度10)。
控製了季節性和長期趨勢
再次重申,需要解決的研究問題是短期變化的結果是解釋為感興趣的接觸;即在我們的例子中,無論是日常死亡率相關日常臭氧含量的變化。但原始結果數據可能是最初由季節性模式和長期趨勢(箱1),所以有必要控製這些模式的回歸模型,以有效地分開從短期暴露和結果之間的聯係,我們很感興趣。有很多方法來實現這一目標,但他們的共同點是,一些時間的函數是擬合的回歸模型。
季節性和長期模式暴露和結果數據可以主導原油關聯,使得短期利益關聯難以檢測。
長期模式,通過顯式地控製暴露之間的關係感興趣的變量(s)和圍繞這些長期短期變化模式可以探索。
選項1:時間分層模型(簡單的指標變量)
約的一種簡單方法模擬結果數據的長期模式研究期間分割成間隔,並為每個區間估計不同的基線死亡風險。在實踐中,這意味著僅僅包括一個指示符變量為每個時間間隔的泊鬆模型。一個可能的選擇每日數據的時間間隔運行日曆月,這樣,在這些數據有12 X 5 = 60層。
優點:易於理解,通常捕獲主要長期模式很好。
缺點:潛在的大量的模型參數;隱式地假定生物難以置信的跳躍風險之間相鄰的時間間隔。
圖2說明了預測的這樣一個日曆月死亡人數分層模型應用於倫敦數據。
選項2:周期函數(傅裏葉計算)
長期模式可以模擬更順利通過擬合傅裏葉計算泊鬆模型。這些是對正弦和餘弦函數的時間與一個潛在的時期反映出完整的季節性周期(即日曆年),並且特別適合捕捉非常普通的季節性模式。一雙單正弦/餘弦模型季節性變化的結果作為一個規則波與單個(等距的)每個日曆年度高峰和低穀(實際指導的波峰和波穀的位置數據)。然而,諧波(額外的正弦/餘弦對波長較短)也可以引入導致更靈活的功能。
優點:模型長期模式順利,使用相對較少的參數。
缺點:比time-stratified更複雜的數學模型;模仿的季節模式總是被迫從一年到下一個相同,這可能反映了數據不好(如冬季高峰死亡的時間可能會有所不同)。傅裏葉條款無法捕捉長期長期趨勢(這可以通過添加一個進一步解決日曆時間的函數)。
圖2b說明了模型適合倫敦數據使用4正弦/餘弦雙(1基本+ 3次諧波)來捕獲季節性,加上一個線性時間的函數來獲取更廣泛的趨勢。
選項3:靈活的樣條函數
第三種選擇合適的樣條函數的時候;這是本質上不同的多項式(最常見的是立方)曲線,順利加入了端到端覆蓋完整的時期。適應了樣條函數在實踐中,我們首先生成一組基礎變量的函數的主要時間變量,然後將這些變量在泊鬆模型的基礎。生成的樣條的基礎上,有必要決定有多少節(連接點)應該是,控製端到端有多少立方曲線將使用,因此如何:靈活的曲線太少無法捕捉的主要長期模式,而太多會導致一個非常“搖擺不定”功能可能與感興趣的變量來解釋的短期變化的興趣,擴大相對風險估計的置信區間。樣條函數有時是框架的靈活性的數量的自由度,而不是數量的節,更多自由度對應節,都意味著一個更靈活的功能。
優點:模型長期模式順利;可以捕獲季節性模式,允許從一年到下一個變化;和長期長期趨勢還將捕獲數據。
缺點:比其他方法更複雜的數學(盡管函數生成花鍵基礎主要統計的是可用的包)。
圖2c演示了樣條函數應用到倫敦數據,使用34節(=(日曆年x 7) - 1],一個共同的選擇每日死亡率數據。雖然沒有共識有多少節最佳,每年7提供足夠的控製已經被證明是一平衡季節性和其他混雜的趨勢,同時保留足夠的信息來估計暴露的影響)。11
殘留在長期變化模式
如果季節性和長期趨勢是控製使用一個以上的方法,我們將留下殘餘的變化不再明顯的長期模式(圖3)。通過添加感興趣的接觸這個模型中,我們現在可以解決我們的主要目的是調查是否剩餘的短期變化在長期模式在一定程度上解釋了風險變量(s)。
Exposure-outcome協會和混淆
在倫敦的數據,擬合的天真的泊鬆模型死亡率,與臭氧作為唯一的解釋變量,沒有調整季節性或長期趨勢,表明每個10µg / m3臭氧濃度的增加與死亡風險比為0.991 (95% CI 0.987至0.994,P< 0.001),即更高的臭氧是降低死亡風險。但是我們知道至少部分解釋這可能是由混雜的季節。添加調整之後的季節和長期趨勢模型(使用一個靈活的樣條在上麵的選項3),估計效果的方向逆轉(RR每10µg / m3= 1.007,95% CI 1.003 - 1.010, p < 0.001;或者說,[0.3 - -1.0]風險增加0.7%),表明在短期內,更高的臭氧與更高的死亡風險。這樣的小尺度效應相對環境流行病學司空見慣,但小的影響往往還是公共衛生重要性如果整個人口暴露。
由其他時變因素混雜
在分析隻對季節調整和長期趨勢,臭氧似乎與死亡率呈正相關。但可以被其他因素幹擾?一般流行病學、常見的混雜因素包括年齡、性別、體重指數、吸煙狀況、喝酒等等,但這些“標準混雜因素”並不適用於我們的數據,因為在人口層麵,這些因素的分布沒有(或不可能)改變一天比一天,並且不能與汙染程度等環境因素的波動。那麼什麼是潛在的混雜因素在這種研究?回想一下,分析的單位是單個行數據所代表的時間間隔(在我們的例子中,天),而不是個人。因此潛在混雜因素應變量,可以改變一天比一天,這在每日的波動有關的我們感興趣的暴露(臭氧),以及結果(死亡率)。在這個例子中,一個清晰的候選人是環境溫度,因為溫度一天天變化,臭氧濃度與溫度(臭氧往往更高在炎熱的日子裏由於陽光在臭氧的生成)的參與,這是良好的溫度與短期內死亡風險有關。3
添加當前溫度的模型(允許預期的非線性4估計ozone-mortality協會)確實對零和調整的效果不再是統計學意義(調整後的死亡風險比每10µg / m3為1.003,95%可信區間0.999 - -1.006,P= 0.11)。這表明最初估計積極目前臭氧水平和死亡率之間的聯係主要是解釋由混雜的溫度。
ozone-mortality協會的其他潛在混雜因素可能包括進一步相對濕度等氣象參數(包括在數據集),其他汙染物和變量捕獲假期和星期(汙染水平可能與群體旅遊行為,這可能會在假期和周末不同,它是高度可信的某些健康風險也不同在這種時候汙染無關的原因),但這些都不是進一步探索。
允許推遲暴露的影響
在倫敦的數據,迄今為止我們的造型相關的死亡率在某一天與臭氧水平在同一天。但是可能有延遲(或“滯後”)接觸和結果之間的聯係。昨天的臭氧水平可能是一個更重要的預測今天的死亡風險比今天的臭氧水平。估計之間的關係昨日的臭氧水平和今日的死亡風險(即天滯後協會)是一個簡單的將臭氧問題係列在時間(即下一行)和重新裝配模型(框2)。圖4顯示了如何估計ozone-mortality協會(調整溫度)的變化我們增加延遲時間從0到7天。有證據表明臭氧和死亡率之間的關聯時,滯後時間是1到5天。然而,這些不同的滯後效應並不是彼此的調整;到目前為止每個滯後模型中安裝一次。為了解決這個問題,所有的滯後變量(0 - 7天改變係列)可以同時輸入模型。這就是所謂的分布滯後模型,應用於倫敦數據,結果顯示的效應估計圖4b。與個人滯後模型相比,所有的效應估計滯後天0到5包容已經走向零,表明(如預期)估計個人滯後影響彼此感到困惑。還有獨立的證據ozone-mortality協會滯後天1和2,表明當前天死亡風險是與臭氧含量呈正相關前2天(或者等價,目前臭氧與死亡率在接下來2天)呈正相關。
一個簡單的相關分析結果的數量在給定的一天的暴露水平。但我們常常希望探索是否有延遲。
通過創建時移暴露變量的副本,包括他們的模型,我們可以探索之間的聯係結果今天和前幾天曝光。
缺點的簡單的無約束的分布滯後模型的滯後可能高度相關,和共線性模型中可能導致不精確的估計(寬置信區間)。可以克服這種強加一些限製估計不同滯後的影響(“有限分布滯後模型”)。圖4c顯示結果的一個簡單的約束分布滯後模型,即影響估計幾天1和2是相同的,效果估計幾天3 - 7包容性是相同的(所謂的“lag-stratified”分布滯後模型,4稱義的廣泛模式顯示在無約束的模型嗎圖4b)。現在共線性減少,需要更少的參數估計,個人估計滯後和協會與更大的精度,但潛在的批評這種方法的約束條件的選擇,如果不是預先確定的,可以認為過於“數據驅動”。更複雜的約束包括平滑(多項式或花鍵)功能可以應用的滯後時間。6
曝光的累積效應滯後幾天可以計算從分布滯後模型係數之和。這些估計通常是相似的約束和無約束模型(如倫敦數據,顯示在右邊圖4b和c),類似的累積效應估計的置信區間寬度約束和無約束模型曾被觀察到。4
潛在的混雜時變因素也可能存在滯後效應,可以以同樣的方式模仿。
短期的位移,或“收獲”
分布滯後模型顯然有時揭示一個奇怪的特點:凸起的風險比短期滯後時間滯後緊隨其後的是一個明顯的保護作用。例如,研究有關環境溫度因心髒病入院的患者發現招生增加了與高溫天,但幾天後高溫集招生卻比預期的要少。12這表明高度脆弱的人在任何情況下住院的幾天內由於心髒病可能隻是有心髒問題提前幾天由於高溫集。這是一種現象被稱為短期位移,或“收獲”。如果收獲似乎存在,短期風險增加的程度是“抵消”通過減少風險在可以確定時間滯後考慮累積暴露和結果之間的聯係在完整的滯後期(估計加法模型係數,如前所述)。
模型檢查和敏感性分析
在開發一個或多個模型,在演講之前必須檢查剩餘地塊,進行敏感性分析,以揭示任何問題與模型假設,異常數據,剩餘自相關,或敏感性的主要結果的決策。13有用的診斷情節基於異常殘差補充附錄中描述(可用補充數據在IJE在線),和其他文件提供更多細節。6,14
此外,由於我們列出的造型過程,涉及到許多決定,我們建議進行多個敏感性分析檢查的主要結論是健壯的這些決策的變化。敏感性分析可能包括季節性變化量的控製和長期趨勢模型中(例如通過改變的節數spline-based方法,或者在傅裏葉諧波計算方法);指定變量“曝光和以不同的方式(例如在倫敦的分析中,我們可以試一試包括相對濕度作為分類變量的線性相反,或調整最大,而不是平均每日溫度);改變落後的方式影響包含在模型;和改變其他關鍵的上下文相關的決策。
精度和能力考慮
據我們所知,幾乎沒有正式的開發力量的計算方法在這種情況下,這可能反映了多數的研究使用二級或定期收集數據,使用所有可用的數據。然而,幾大點。確定研究的精度因素包括係列的長度(如天數)和事件的數量(如死亡)。Overdispersion(計數)的高可變性也可以降低精度。對權力大小的影響,是合理的也是很重要的。在作者的經驗,研究汙染的影響,最常見的應用程序,需要成千上萬的觀測天平均每天的事件,為可靠的精度和權力。
進一步的擴展
非線性exposure-outcome協會
感興趣的曝光和其他時變混雜因素可能非線性關聯的結果。
這在其他場合下可以建模為:通過使用分類變量,二階或高階多項式,靈活的樣條曲線或分段線性閾值的模型。4
調查的效果修飾符
方麵的個人因素仍然是影響修飾符(如老年人更容易受到任何不利影響臭氧?)。
這可以調查可以提供整體結果項分解成基於潛在影響修飾符stratum-specific計數。
從多個位置的分析數據
單獨的位置(如特定的城市)的分析可以增加力量和提供信息異質性和適應環境暴露。
模式在具體地點的影響估計可以通過技術來探索類似於那些用於薈萃分析,15或者造型單一location-stratified模型中的所有數據。2
總結
在本文中,我們列出了所涉及的關鍵步驟和複雜性進行一個基本的時間序列回歸分析(盒3),並說明這些的一個例子。特定的時間序列回歸問題的存在長期和季節性模式,推遲或非線性關係的可能性和結果,並存在自相關。除了這些,時間序列回歸與回歸方法在其他領域,和廣泛的步驟(繪圖和製表數據,控製了混雜,呈現適當曝光效果和模型檢查)將熟悉的流行病學家從所有學科。
探索數據和簡單的情節和表格:
情節的暴露與時間變量(s)
與時間的結果
相關矩陣的曝光和結果變量
摘要統計信息為每個變量
總結每個變量的缺失的數據。
方法控製對季節性和長期趨勢:
時間指標變量層(time-stratified模型)
時間周期函數(正弦/餘弦函數)
靈活的樣條函數的時間。
造型的exposure-outcome association-immediate vs延遲效應:
個人滯後模型考慮不同滯後一次
分布滯後模型考慮所有的落後一個模型(減少共線性無約束或限製)
考慮可能的非線性關聯和其他回歸上下文。
模型檢查
診斷情節基於異常殘差網絡(見附錄)
多個敏感性分析改變造型的關鍵決策
資金
沒有具體的融資受到這項工作。K.B.支持國家健康研究所博士後獎學金(批準號nihr - pdf - 2011 - 04 - 007)。A.G.由醫學研究委員會支持方法研究獎學金(批準號G1002296)。支持L.S.威康信托基金會高級臨床科學研究獎學金(批準號082178)。
利益衝突:沒有宣布。
時間序列回歸常用於研究試圖量化環境因素的短期協會,如空氣汙染、花粉、灰塵或天氣變量,與健康結果。
時間序列數據在這些情況下可以使用泊鬆回歸模型,分析了一些擴展處理問題特定的時間序列回歸,包括長期的和季節性的存在模式,推遲或非線性關係的可能性和結果,並存在自相關。
其他步驟參與執行時間序列研究(繪圖和製表數據,控製了混雜,呈現適當曝光效果和模型檢查)將熟悉的流行病學家從所有學科。