條文本
文摘
目標比較兩個貝葉斯模型能夠識別異常和不穩定的時間數據在時空模式。
設置年度統計當地用戶從每項檢查(SLA)在布裏斯班,澳大利亞,記錄在1997年和2008年之間包容。
主要結果測量乳房x光檢查篩查。
結果91年的時間趨勢sla(58%)與整體共同的時間趨勢。sla後常見的時間趨勢也傾向於穩定的時間趨勢。sla與不穩定的時間趨勢往往是位於遠離城市,遠離乳腺癌篩選設備。
結論本文演示了兩個模型的有效性識別異常和不穩定的時間趨勢,和獲得的協同模型都適用於相同的數據集。分析這些模型提供了有趣的見解乳房x光檢查篩查的時間趨勢項和進一步的研究展示了幾種可能的渠道,如擴展模型允許多個常見時間趨勢和占額外的時空異質性。
- 流行病學
- 公共衛生
- 統計數據和研究方法
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/
來自Altmetric.com的統計
本研究的優點和局限性
給出的模型允許空間和時間的聯合分析,提供有用的見解趨勢相關的一個主要的健康問題。
模型數據,提供良好的預測。
模型規範的某些方麵可能過於嚴格。
額外的數據,如篩選項在農村地區目前還不清楚。
介紹
乳腺癌是最常見的一種類型的癌症在澳大利亞遇到的女人,第二個癌症相關死亡的最常見原因,僅在2011年占2914人死亡。1證據表明,定期乳房x光檢查篩查可有效檢測早期乳腺癌從而增加生存的機會。2 - 6然而,最近的研究表明,乳房x光檢查篩查服務可能開工不足由於地理因素,如旅行距離一個乳房x光檢查篩選設備。6 - 8
Hyndman等6進行了一項研究,調查的影響距離一個乳房x光檢查篩查設施和社會劣勢服務利用率。這項研究發現,女性社會經濟地位較低有更多的困難前往一個乳房x光檢查篩查設施,並建議應該位於靠近弱勢社區設施利用率增加。然而,乳房x光檢查篩查設施的位置的影響是不太清楚當時社會經濟因素沒有顯著作用服務利用率。在另一個工作,Legler等9模擬狀態的乳房x光檢查篩查率取決於服務用戶人口統計,縣級社會經濟因素和以前的乳房x光檢查幹預研究項目。發表的研究發現,與一個或多個州和國家幹預研究水平較高的教育傾向於乳房x光檢查篩查服務利用率更高。澤克等8評估了空間可達性的被低成本或免費檢查服務在芝加哥,她做了模特距離和時間前往一個設施地理和社會人口變量的函數包括種族和貧窮。研究得出的結論是,旅行時間和距離通常是減少貧窮地區,除了與更高比例的非裔美國人社區的居民。從這項研究目前尚不清楚,但是,如果這些障礙訪問翻譯成低篩選利用自乳房x光檢查篩查利用率沒有考慮。
上述研究中使用的方法有很大區別。Hyndman等6利用地理信息係統(GIS)技術和篩選數據從六個乳房x光檢查篩查設施在珀斯,澳大利亞。Legler等9選擇了層次模型來估計的影響教育、職業和人群在乳房x光檢查篩查率為每個狀態。該模型適合收集的數據在兩個時間點,1987年和1993 - 1994年,它標誌著期間發表大量的幹預研究。雖然模型應用於數據在兩個時間點,它隻包括協變量空間,從而限製推斷每個時間點的兩種安裝模式之間的差異和空間效果。澤克等8使用普通最小二乘回歸模型來估計協變量的影響在可訪問性措施。然而,作者發現殘差表現出空間自相關,即使內生空間滯後回歸使用。此外,旅行時間和距離估計使用GIS和其他軟件而不是觀察,並要求大量的假設,增加了不確定性和潛在的偏見的估計。
文獻包含了許多其他的研究,分析利用率低成本或免費檢查和相關數據。這些研究的重點通常是旨在估計的影響一個或多個變量篩選率。這些變量通常是空間依賴和服務用戶的人口統計數據,包括相關的社會經濟因素,可訪問性因素和變量的空間單位研究城市化的程度等。7,10 - 13而估計的協變量影響乳房x光檢查篩查利用率是有用的,人們卻很少關注識別篩選利用率趨勢,尤其是趨勢隨空間和時間。分析這種趨勢允許更多種類的統計推斷,對服務管理與影響。此外,忽略了空間和時間相關性時可能導致錯誤的預測和推斷。14
本文旨在建立在先前的研究在這個領域呈現兩個時空模型,應用於設施免費檢查考勤數據在布裏斯班,澳大利亞。簡而言之,這些模型是為了確定“不尋常的”或“不穩定的”時間模式。使用術語“不尋常的”和“不穩定”模型具體,及其含義進行了進一步的詳細方法。
天性,時空數據可以集中和/或autocorrelated,和有時是稀疏的,一些地區表現出相對較低的預期數量的觀察和計數。空間模型通常由編碼社區信息占這些問題的更廣泛的模型。這額外的好處,減少估計風險高的不確定性意味著風險。貝葉斯方法自然地把這些信息用先驗分布和層次模型結構,並允許一個完整的估計未知參數的概率模型。8,15—
兩種模型考慮本文的共同點的規範空間和/或時間隨機效應,盡管在不同的形式,和一個模型指標的區分sla,表現出一個共同的穩定時間趨勢而不是一個不尋常的/不穩定的時間趨勢。模型使用貝葉斯估計技術和克服困難與autocorrelated相關數據通過顯式地包括在模型空間和時間依賴關係。
方法
數據
在這項研究中使用的數據的訪問的數量做乳房x光檢查篩查設施由BreastScreen每年昆士蘭州布裏斯班地區,從1997年到2008年包容性。每年,訪問記錄的數量統計當地(SLA),與158年SLA包括布裏斯班地區。合格的人口被定義為女性年齡為40歲或以上的篩選,符合澳大利亞BreastScreen項目合格標準。3
的物理位置和開啟和關閉日期乳房x光檢查篩查設施也被記錄下來。一些乳房x光檢查篩查設施移動,因此隻能在較短的時間內的特定位置。使用這些數據,協變量 創建代表相對可用的服務集水區域,定義為 1在哪裏 的累計天數在SLA每個乳房x光檢查篩查設施操作嗎 或任何與SLA接壤的SLA , 在一年 , 。這對多年排水區服務可用性中以圖形的方式描述圖1。
社會經濟地位也作為協變量。然而,社會經濟數據的初步分析並沒有顯示效果的證據。出於這個原因,它是排除在最終的模型。
模型公式
提出了兩個模型的時空分析數據。兩種模型都是貝葉斯空間廣義線性混合模型(GLMMs)屬於更廣泛的一類線性模型。月19 - 21日
讓 表示訪問檢查設施的觀察計數在SLA 在一年 。鑒於人口處於危險之中 ,相應的預期數量的訪問是由 在哪裏 是篩選的引用率 。22
第一個模型被認為是BaySTDetect李提出的模型等。23這個模型包含兩個相互競爭的模型:一個共同的趨勢模型,每個SLA的時間趨勢是相同的,我們采取具有地域特點的工作模型,時間趨勢被允許離開共同趨勢。兩個相互競爭的模型層次結構和相關的可能性通過模型選擇的步驟,給出了方程(2),BaySTDetect模型假設 數量是一個泊鬆隨機變量,例如,
在哪裏 2 3
的組件方程(2)如下: 是常見的攔截; 和 分別隨機效應的空間和時間; 是我們采取具有地域特點的工作攔截; 隨機效應,我們采取具有地域特點的工作嗎 是定義的協變量方程(1)。關於之前的 ,預計時間趨勢相當均勻對於大多數sla,因此hyper-parameterδt選為0.95。將時空平滑,內在條件自回歸(ICAR)先知先覺24被分配在隨機效應 和 : 4 5 6在哪裏 表示不包括所有領域 和 是 元素的一個對稱的空間鄰接矩陣 與元素 如果 和 區域是鄰居,否則和零。同樣,\ t表示所有年扣除 和 是 元素的一個對稱的顳鄰接矩陣 與元素 如果 和 年的鄰居,否則和零。注意,時間是相同的每一個鄰接信息 方麵, 。
的參數 , , 和 是假定為正態分布均值為0,方差1000。的hyper-parameters 和 被分配弱信息half-normal先驗反思缺乏先驗知識對這些參數但嚴格限製他們的價值觀是積極的而不是太大。25hyper-parameter之前 是對數正態分布, 給定一個方差的信息相對於數據之前, 以反映之前預期的顳可變性。23
第二個模型被認為是Abellan提出的基於混合模型的方法等。26這個模型估計公共空間和時間趨勢的基礎上,數據和確定sla的剩餘時間模式顯示波動,不穩定。在這個層次模型,數量 被建模為泊鬆隨機變量與的意思嗎 例如, 7
這裏的術語 是常見的攔截;λ我和 分別代表了隨機效應的空間和時間 代表space-ime交互。像BaySTDetect模型、空間和時間隨機效應模型聯合使用ICAR先知先覺, 8 9在哪裏 和 是前麵定義(見方程4 - 6)。正常的先知先覺為攔截和協變量定義效果而言, 當先驗分布 是由兩個正態分布的混合描述不同的差異,一個代表穩定模式和其他不穩定模式:
方差是由潛在的模型指標變量 在模型中指定的多項分布組成的一個畫, 混合舉重之前在哪裏 狄利克雷分布:
如果潛在的指標以價值 被模仿 或者2 被模仿 , 。為了避免標簽切換的問題,27,28和符合模型規範,指定為兩個方差的先知先覺 在哪裏 表示指標函數 。
通過分析後的指標變量的頻率 ,這種混合模型可用於確定sla時間不穩定的趨勢。例如,我們 10代表的後驗概率 遵循 的後驗概率,即時空交互有巨大的差異。因此越近 值為1,和更多 值接近1 越不穩定的時間模式i SLA。Abellan等26提出兩個規則分類sla的不穩定。第一個規則考慮了 SLA是不穩定的 至少一個 ,在那裏 是一些指定的閾值。第二個規則分類 SLA是不穩定的,如果三個最大的平均值 值 。規則2稍微保守的因為它平均 值超過三年。這兩個規則。
比較兩個模型
盡管不尋常的和不穩定的時間趨勢之間的區別可能看起來微不足道,這兩個模型旨在解決兩種截然不同的時空模式的相關問題,因此每個模型可以提供獨特的見解。
BaySTDetect模型假定一個共同的時間趨勢, ,在所有地區和使用模型選擇一步適應競爭模型與獨立隨機時序效應對每個區域如果有相當大的背離共同趨勢。這允許識別sla的一個不尋常的時間趨勢。例如,假設平均使用率不斷檢查(共同趨勢),然後sla,表現出高檢測率一年後跟一個低利率明年將被認為是一個不尋常的時間趨勢,因此最有可能會模仿我們采取具有地域特點的工作模型。
相比之下,時空混合試圖估計整個時空的趨勢。如果給定SLA的年度篩查方麵有很大的不同從預測的模型,那麼這個明顯背離整個時空的趨勢表明,SLA的篩查率是不穩定的。
實現
兩個模型估計使用馬爾可夫鏈蒙特卡羅(密度)技術,實現WinBUGS通過使用R2WinBUGS包(R核心團隊。R:語言和環境統計計算(互聯網)。維也納:R統計計算的基礎;2012年[引用2014年12月1]。http://www.R-project.org/)。29日,30.結果是基於25 000次迭代後丟棄一個初始100 000次迭代老化。收斂非正式評估是通過視覺檢查跟蹤和密度的情節,以及正式使用Geweke融合診斷。31日
最初,兩種模型實現了指定的層次結構和先驗各自作者如上所述。這些模型被適應我們感興趣的科學問題通過修改。主要的變化涉及造型空間和時間隨機效應模型 , 和 直接使用ICAR先知先覺,而不是模型各自的意思,之間由於缺乏強烈的自相關參數和參數的可識別性問題(結果未顯示)。兩種模型也擴展到包括協變量的方程(1)。
原理圖的BaySTDetect和混合模型,考慮到上述變化後,在網上提供補充圖S1和在線補充圖網上S2分別。WinBUGS代碼也提供了,在網上補充代碼1和2。關鍵模型參數的後驗分布每個模型總結在圖2 l和3光學。
結果
圖2顯示了後對模型指標參數 這代表選擇共同趨勢的後驗概率模型 SLA(參考(3))。對於sla的後部的意思 接近於零,訪問乳房x光檢查篩查設施嗎 好模仿我們采取具有地域特點的工作模式,因為這些sla時間趨勢明顯不同於常見的趨勢 。這是對大多數sla中,91 (58%)sla後的意思 ≤0.05,61人(39%)實際上sla後的意思 等於零。的 sla的值與一個更大的平均人口風險傾向於有一個小後的意思,表明sla的時間趨勢更大的人口風險往往是少類似於常見的時間趨勢。這些後的空間形成提供了手段圖5。
圖2B, C顯示後的參數空間(在對數尺度)的影響,對於我們采取具有地域特點的共同趨勢和工作模型,分別。雖然大多數的後的手段 接近於零,零隻包含在5的95%可信區間(CIs)和少量的這些手段非常遠離零。特別是,八個sla的後意味著<−5對應的sla和零觀察計數。的後驗分布 我們采取具有地域特點的工作模型是相似的 在大多數後意味著接近於零,這是相同的八sla有很大的負麵後的意思。順便說一句,這八個sla的最小八聚合L-criterion估計,可以很容易識別圖4白色區域。
後驗密度參數的協變量的影響 在兩個相互競爭的模型所示圖2D, e .這些參數的密度表明積極的邊際效應的排水服務利用協變量,也就是說,傾向於服務sla利用率要高,屬於一個乳房x光檢查篩查設施的排水區,正如所預期的那樣。
圖2F顯示了參數後的時間共同趨勢模型的影響。後通常意味著降低隨著時間的推移,指示一個相當一致的下行趨勢。觀察項訪問檢查設施,然而,通常隨著時間增加。雖然這個結果是令人驚訝的,但時間影響很小。更有趣的是,很少有各自的時間趨勢的sla同意這種普遍趨勢,所表示的後的手段 。這在一定程度上解釋我們采取具有地域特點的各種時空趨勢工作模型。後這些時空趨勢的方法 6選擇sla所示圖2G-L。
時空混合模型
盡管BaySTDetect模型旨在確定sla以不同尋常的時間趨勢、時空混合模型的目的是確定sla的剩餘時間趨勢展品波動。圖3一個顯示了協變量的後驗密度參數效應,其評估和解釋是可比的 在BaySTDetect模型中。圖3B顯示了後的手段 ,這是幾乎相同的空間效應BaySTDetect模型中的術語。(八的最小值 對應的sla零觀察計數。)
時間效應 所示圖3C表示輕微,整體下降趨勢。雖然這不同於常見的時間趨勢BaySTDetect模型,這兩種情況下的效果是小的。
圖3顯示後,95% d - i CIs時空交互作用 同樣的六個選定的sla圖2分別G-L。他們表現出多種SLA-specific時間趨勢相似 在BaySTDetect模型中。圖3J-O顯示的後意味著潛在的指標變量 與時空交互參數(等於相關聯 )。通過分析後驗概率 由方程(10),可以確定sla剩餘時間不穩定的趨勢。這兩個規則分類Abellan提出的不穩定的sla等26使用各種不同的值用於嗎 ;結果總結圖形圖6。
討論
本文提出了兩種貝葉斯分層時空模型被用來分析免費檢查服務的利用模式在布裏斯班12年。與先前的研究相比,模型試圖確定sla的不尋常的或不穩定的時間模式的初始步驟改善管理這些服務。結果BaySTDetect和時空混合模型提供一個有用的洞察在乳房x光檢查篩查服務利用空間和時間模式。
首先,BaySTDetect模型強調了大量的sla的不尋常的時間趨勢相對於常見的趨勢。雖然協變量相對可用的服務是包括在模型中考慮到移動設備搬遷和設備操作時間,為這些sla服務利用率逐年變化的方式不同於常見的趨勢。
第二,盡管BaySTDetect模型估計一個共同的時間趨勢 ,這不是常見,很少sla展覽這個特殊的時間趨勢。要理解為什麼是這種情況,考慮到時空的趨勢 我們采取具有地域特點的工作模型。圖2我們采取具有地域特點G-L顯示工作時間趨勢殘差六選定的sla。SLA 10, 展覽一個相當穩定的上升趨勢;SLA 22顯示下降趨勢;SLA 57有獨特的振蕩模式;SLA 68件展品前7年的振蕩模式緊隨其後的是一個相對穩定的上升趨勢;SLA 92沒有可識別的模式和SLA 158有一個持續的趨勢。這各種各樣的趨勢表明,不是一個而是幾種常見時間趨勢,並解釋了為什麼我們采取具有地域特點的工作模型是青睞的貝葉斯模型選擇。鑒於sla的大部分的時間趨勢偏離共同趨勢,偏離這一趨勢應該小心解釋。
第三,有一個明顯的相關性sla,遵循共同的時間趨勢(較輕的地區圖5)與穩定時間趨勢和sla(白色區域圖6)。這是最明顯的較小值 ,特別是當規則1用於分類不穩定的sla。這是不足為奇,因為常見的時間趨勢本身就是相當平(大約隻有−0.02和0.02之間範圍),也就是說,穩定。然而,也存在sla的時間趨勢不尋常但穩定,和sla的時間趨勢通常但不穩定。
第四,時空混合模型的分析確定sla的數量不穩定,取決於的價值 以及使用的分類規則。圖6表明,不穩定的sla往往坐落在布裏斯班郊區地區,也就是說,sla農村比城市往往更不穩定,特別是對於較大的值 。比較圖1和6,這些不穩定的sla也傾向於集水區以外的地區。這表明,距離放映設施影響客戶端訪問檢查服務的一致性。
最後,預測與零值八sla觀察計數是最符合BaySTDetect和混合物中的數據模型,最小的L-criterion估計就證明了這一點。這意味著現有的模型組件和不適當的會計缺乏從這些sla服務利用率。圖1表明這些sla往往落在集水區,這加強了服務利用率的概念受到距離最近的篩查工具。
本文提出的兩個模型並不是沒有限製的。李等23提出了一個擔心的時間段的數量BaySTDetect模型檢測時間的變化趨勢。作者建議單個模型的指標 為每個SLA時可能會限製太多的時間的數量> 10因為當前設計假定隻有一個共同的時間趨勢對整個時期,這是不太可能的縱向數據收集許多時間點。這可以通過改變模型解決指標適用於sla和年,說 。BaySTDetect模型的另一個潛在的問題是之前的先天的規範模型的指標, 。李等23使用0.95的伯努利概率方程(3)來反映他們的信仰,隻有一小部分的區域實際上是不尋常的。這之前,而信息可能是足夠的慢性疾病死亡率數據分析由李等,23但是基於結果表明大部分不同尋常的sla;它可能是更合適的指定hyperprior伯努利概率,也許使用額外的空間協變量信息,如果可用。
同樣,狄利克雷之前 在混合模型可以擴展到包括額外的空間和/或時間的影響。的維數的變化 來 , 或 應該直接因為時空的效果嗎 已經被時間和空間索引。然而,這可能會增加顯著的計算負擔。
在這兩種模型,有大量的參數估計,其中一些後意味著接近於零(尤其是一些時空趨勢 和 )。可能會帶來好處歸零等參數使用適當的飆升和板坯先知先覺。
在這項研究中,觀察到的數據之間的空間自相關為任何給定的一年似乎弱,所表示的後的手段 和 所示,圖2 b和3b .然而,空間自相關的措施如莫蘭的我和吉爾裏的C顯示相反(結果未顯示)。盡管Geary C更敏感的局部空間自相關,這樣的空間自相關統計數據暗示在這個數據集全局而不是本地,因此通過ICAR先驗也許不是很容易的被捕獲。結果可能會提高通過改變鄰接重量元素 為二階和三階的鄰居是非零的,例如。
一個可能的擴展Abellan的工作等26擔憂的規則用於分類sla那樣不同尋常。Abellan提出的方法等26允許確定SLA時間不穩定的趨勢,但方法確定SLA是不穩定的程度無疑會更加豐富,從BaySTDetect模型與結果。未來研究的另一個途徑是不同的協變量包含額外的空間和/或時間,可訪問性等公共交通,提高推理有關空間和/或時間的趨勢。
L-criterion值還提供洞察觀察到的趨勢。這是推測,大 值可能是由於一些未知因素的影響如私人乳房x光檢查篩查設施提供的服務。兩種模型的預測性能往往隨時間減少,年平均 1997年和2008年之間的值增加了大約4。包含其他時間因素可能在晚年改善預測性能。
總的來說,本文表明BaySTDetect和時空混合模型是有用的在分析乳房x光檢查篩查服務利用率數據。特別是BaySTDetect模型能夠識別sla的時間趨勢,不同於整體時間趨勢,和時空混合模型確定sla時間不穩定的趨勢。分析這些模型顯示的洞察模式觀察到的趨勢,並顯示潛在的重要因素沒有考慮。
確認
作者感謝兩個評論者的洞察力的評論和建議,這大大促進了提高質量的手稿。作者承認副教授Adrian Barnett公共衛生和社會工作學院昆士蘭科技大學的,因為他敏銳的評論和反饋較早的一份草案的手稿。
引用
腳注
貢獻者EWD應用模型和分析數據,準備了一個初稿的手稿,手稿的修改過程中的合作。NMW和公裏做出實質性貢獻的方法設計和開發模型,提供了重要的意見和建議對所有草稿的手稿,並協助在模型和數據的分析和解釋。所有作者批準出版的手稿的最終稿。
資金這項工作是支持的合作研究中心(CRCSI)的空間信息,由澳大利亞聯邦資助的活動的合作研究中心計劃。本研究也支持在澳大利亞研究理事會(ARC)卓越中心為數學和統計前沿(ACEMS)(項目號CE140100049)和弧發現項目(DP140103564數量)。
相互競爭的利益沒有宣布。
病人的同意獲得的。
倫理批準昆士蘭科技大學的人類研究倫理委員會。
出處和同行評議不是委托;外部同行評議。
數據共享聲明沒有額外的數據是可用的。