條文本

下載PDF

預測模型來估計電子醫生聲稱數據庫的完整性
  1. 麗莎M Lix1,
  2. 雪麼2,
  3. 喬治Kephart3,
  4. 積極全4,
  5. 馬克•史密斯5,
  6. 約翰保羅Kuwornu1,
  7. Nitharsana Manoharan6,
  8. 威爾弗裏德Kouokam7,
  9. Khokan Sikdar4
  1. 1社區衛生學係,曼尼托巴大學,溫尼伯、加拿大
  2. 2溫尼伯地區衛生行政部門,溫尼伯、加拿大
  3. 3社區衛生學係,達爾豪斯大學,哈利法克斯、加拿大
  4. 4社區衛生學係,卡爾加裏大學,卡爾加裏、加拿大
  5. 5馬尼托巴省中心衛生政策,曼尼托巴大學,溫尼伯、加拿大
  6. 6臨床評價科學研究所,多倫多、加拿大
  7. 7科學和工程科學學院,大學德Bretagne-Sud,、法國
  1. 對應到麗莎M Lix博士;lisa.lix在{}med.umanitoba.ca

文摘

目標電子醫生稱數據庫是廣泛用於慢性疾病研究和監測,但數據質量可能隨醫生特征,包括支付方式。目標是開發一種預測模型的數量普遍收費服務(FFS)電子醫生宣稱糖尿病病例數據庫和應用它來估計病例中non-FFS (NFFS)醫生的數據往往是不完整的。

設計一個回顧性觀察隊列設計采用。

設置加拿大紐芬蘭和拉布拉多省的數據被用來構建預測模型和數據從馬尼托巴省的被用來在外部驗證模型。

參與者一群診斷糖尿病病例從醫生確定索賠,被保險人居民注冊表和住院記錄。一群FFS醫生負責醫生的診斷是確定索賠和注冊表數據。

主要和次要結果的措施廣義線性模型與γ分布是用來模擬糖尿病病例的數量/ FFS醫生醫生的函數特征。預計每NFFS醫生估計糖尿病病例數。

結果糖尿病隊列由31 714人;平均情況下每FFS醫生為75.5(值= 49.0)。性和年專業許可顯著相關(p < 0.05),病例數/醫生。將預測模型應用到NFFS醫師注冊表數據導致估計18 546例;隻有411在索賠數據。模型證明了表麵有效性在一個獨立的數據集。

結論比較觀察和預測疾病generalisable情況下是一個有用的方法來評估質量的電子數據庫以人群為基礎的研究和監測。

  • 統計數據和研究方法
  • 公共衛生
  • 流行病學

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 本研究開發了一種預測模型估計的完整性non-fee-for-service電子醫生申請獲取服務人群。

  • 在這項研究中開發的預測模型是一種有效的和潛在generalisable工具日常管理數據完整性的大小估計。

  • 本研究強調,不完整的電子醫生聲稱應該補充與其他數據源的數據,包括電子病曆,以確保全麵的數據為慢性疾病研究和監測。

  • 研究側重於電子糖尿病醫生聲稱數據庫的完整性;研究應該擴展到其他慢性疾病,以確保其generalisability。

介紹

電子行政衛生數據庫廣泛用於基於人群健康研究和監測。1,2這些數據庫的流行有以下幾個原因:他們可以及時,提供大量的個人信息,和相對便宜的訪問和使用。醫生聲稱電子數據庫,其中包含門診醫療信息聯係,獲取信息更大比例的人口比住院醫院記錄,但質量索賠數據庫往往是貧窮的醫院記錄的數據采集和編碼標準存在。3,4研究因此稱數據庫是必不可少的質量評估和改善他們的準確性。然而,大多數研究醫生聲稱數據庫隻關注診斷代碼的有效性,5 - 8而其他的數據質量元素可能會影響這些數據的有用性研究和監測很少被研究。9

醫生聲稱數據庫的不完全性,這可能導致明顯偏見的估計疾病患病率和醫療利用率、可能出現的原因。這些數據庫中的信息是用於酬勞醫生對病人提供的服務,通常在收取費用(FFS)基礎。然而,醫生沒有獲得酬金的FFS方法可能在這些數據庫不一致記錄病人接觸。具體來說,non-FFS (NFFS)醫生,他們通常通過支付工資和合同,並不總是需要使用相同的索賠提交流程作為FFS醫生,10這一過程稱為影子計費。不完整的捕捉NFFS醫生聲稱可以造成嚴重後果;先前的研究已經證明大幅低估的糖尿病患病率與缺乏陰影計費。11

可能的方法來估計電子管理數據庫的完整性12日至16日包括:(1)對比觀察到預期數量的情況下,在預期情況下估計參數或非參數模型,(2)比較病例數確定行政數據庫情況下確定從驗證數據庫,使用之前的模型(3)和(4)進行數據庫審計。這些方法主要是應用於癌症登記處和醫院的記錄,而不是醫生聲稱數據庫。因此,本研究的目的是開發一個基於模型預測普遍從FFS醫生宣稱糖尿病病例,應用它來估計病例NFFS醫生中,數據可能不完整。我們關注糖尿病,因為行政衛生數據庫具有很好的敏感性和特異性例標識使用電子管理數據庫和監測的糖尿病是全世界的利益。6

方法

預測模型的數據源

數據構建的預測模型是加拿大紐芬蘭和拉布拉多省的東部(NL),有大約515人口000根據加拿大統計局2011年的人口普查。問醫生的報酬由NFFS方法不提交shadow-billed聲稱省衛生部,17雖然醫生獲得酬金的FFS方法向衛生部提交所有的索賠。問有一個更大比例的NFFS醫生比大多數加拿大其他省份。18

醫生稱,醫生注冊記錄,出院摘要和保險的居民登記記錄從2002年4月1日到2004年3月31日被用來進行這項研究。我們選擇這些年來因為問醫生注冊中心包含全麵的信息在這個時期所有注冊醫生但日後是不完整的;注冊表醫生薪酬信息的方法,包括性別,年齡,專業,年獲得了醫學學位和衛生區域的實際位置。每個醫生聲稱包含一個三位的診斷代碼使用國際疾病分類記錄,第九次修訂(ICD-9)和日期。出院摘要包含入學日期和放電和20 ICD-9 ICD-10-CA診斷代碼。醫療保險的居民注冊中心包含日期,性別、出生日期和衛生區域所有居民醫療保險福利的資格。醫院醫生稱,分離提取和保險的居民登記記錄可鏈接使用一個獨特的,匿名病人標識符。醫生宣稱和醫生注冊也可鏈接使用一個匿名醫生標識符。

預測模型的研究對象

糖尿病病例隊列由所有人遇到一個驗證情況下定義,這至少需要一個住院或至少兩個醫生帳單聲明(ICD-9代碼250;ICD-10-CA代碼E10-E14)在730天的期限內。5,19個人< 20歲或沒有醫療保險的日期case-qualifying診斷被排除在外。病例從醫院出院小結,確定的日期case-qualifying診斷住院的日期;日期的情況下確定醫生聲稱,case-qualifying診斷是醫生要求的日期730天內的第二次診斷。糖尿病病例分為三個互斥組:(1)情況下確定隻有從醫院出院小結,(2)情況下確定醫生主張從FFS case-qualifying診斷的醫生和醫生(3)情況下確定申請從NFFS case-qualifying診斷是醫生。最後一批由索賠的情況下,少量的NFFS醫生收到一部分由FFS支付報酬。而後者兩組病例可能出院抽象與糖尿病的診斷,他們有資格為例基於至少兩個醫生的賬單與糖尿病的診斷。

醫生群體包括所有成員的醫生注冊至少一個要求個體在糖尿病病例隊列。每個醫生都分配給每個成員的第二和第三組的糖尿病病例隊列基於醫生發現身份證號碼計費要求case-qualifying糖尿病的診斷。

統計分析預測模型

糖尿病的情況和醫生群體被描述使用手段,SDs、中位數、頻率和百分比。均值和中位數每個醫生估計的糖尿病病例數和分層醫生群體特征。

多變量廣義線性回歸模型與γ分布適合糖尿病病例的數量為每個FFS醫生。20.協變量模型收到年專業(四分位數;參考=最低四分位數),醫生性(參考=女性),健康的實踐(參考=拉布拉多,問的偏遠地區)和專業(參考=專家)。年專業與歲因為醫學學位和高度相關(r≥0.80),因此後者兩個變量被排除在外。主效應模型相比,模型主要和雙向交互作用。20.懲罰擬合優度措施,包括Akaike信息準則(AIC),21被用來選擇最適合的模型。的比例異常的自由度是用來評估模式色散。

模型驗證

我們選擇加拿大馬尼托巴省的外部驗證(MB),它有120萬人口根據加拿大統計局2011年的人口普查。NFFS醫生在這個省省衛生部提交shadow-billed索賠。沃森22報道稱,在溫尼伯家庭醫生執業中,唯一的主要中心MB(680人口000 +),90%的醫生獲得酬金的NFFS方法提交申請給病人提供的服務。然而,影子計費率預計將降低在其他地區的省份。

相同的數據源在MB可用在問,與數據庫的細微差異特征。具體地說,醫生聲稱在MB包含診斷代碼基於ICD-9-CM(即臨床修改)。23MB醫師注冊表不包含信息的醫學學位。5衛生區域,由衛生部計劃定義的醫療服務的提供,是用來識別病人居住和醫生實踐地點。

內部驗證是問和MB的模型進行的。預測精度的措施,其中包括偏差,平均絕對誤差(MAE)和均方根誤差(RMSE),24基於10倍交叉驗證計算。25,26

模型預測

最後問擬合模型被用來預測普遍糖尿病病例的數量每NFFS醫生。然而,考慮到並不是所有NFFS醫生為糖尿病患者提供服務,我們使用了FFS醫生醫生群體比FFS醫生的總數27選擇一個隨機樣本的預測。類似的過程是用來預測的病例數MB數據。在MB,我們也比較了預測糖尿病病例數量NFFS醫生觀察到的病例數NFFS shadow-billed聲稱的醫生。

普遍的糖尿病病例的總數估計在每個省的總和:(1)觀察到的情況下確定從醫院出院小結,(2)觀察到的情況下確定從FFS醫生的說法,(3)預測例NFFS醫生。分母的患病率估計是基於2001年加拿大統計局普查數據;95%順式計算使用二項分布。

使用SAS V.9.3都進行了分析。數據訪問提供的批準是紐芬蘭和拉布拉多衛生信息中心和馬尼托巴省衛生信息隱私。

結果

描述性分析

共有31 714流行的糖尿病病例問行政數據(表1);91.1% (n = 989) 28日計費的病例的醫生獲得酬金的FFS,而1.3% (n = 411)的病例確定賬單提交的索賠NFFS醫生收到了FFS一部分報酬。近三分之二(60.7%)的糖尿病病例從FFS醫生聲稱東衛生區域的居民,其中包含問最大的城市(200年000 +人口);40.5%的人65年以上。

表1

糖尿病病例隊列的特點確定源和省

51 MB外部驗證數據,031年流行的糖尿病病例(表1),其中84.1%是確定從計費FFS醫生的說法。四分之三(75.9%)的普遍情況下確定NFFS shadow-billed聲稱的醫生來自non-Winnipeg衛生區域。

有388個人在問醫生群體(表2)。在FFS醫生(93.3%),絕大多數是全科醫生(80.4%),大部分來自東衛生區域(71.3%)。MB醫生群體包含超過1200個醫生,其中80.4%是FFS醫生。在這些FFS醫生中,一半以上(57.8%)在40 - 64歲年齡組。NFFS醫生(n = 270)主要是< 40年(68.5%)和近80%城市溫尼伯衛生區域以外的練習。

表2

醫生群體薪酬的方法和特點

表3描述了普遍的均值和中位數號碼每FFS醫師糖尿病病例。在問,每個FFS醫生普遍情況下的平均數量為75.5,平均為49.0。均值和中位數高全科醫生比專家和男性比女性。MB,平均每個FFS醫生的普遍糖尿病病例數是43.4,平均為25.0。

表3

意味著(SD)和流行病例數中值的糖尿病病例隊列/收費服務醫生醫生群體

預測模型

問,主要影響數據模型提供了一個不錯的選擇,根據模型偏差的比值的自由度(比= 1.0)和AIC小主效應模型比與一個主要和雙向交互作用(3833.1 vs 3830.4);似然比測試結果顯示顯著性(p < 0.0001)和主要影響年專業(p = 0.0006)。

MB的產生類似的結果回歸分析外部驗證數據;模型偏差的自由度比接近1.0的主要影響模型。主要的模型和雙向交互作用導致了AIC的減少可以忽略不計。的主要性的影響(p < 0.0001),專業(p = 0.0021)和年專業許可具有統計學意義(p < 0.0001)。

對內部交叉驗證,問模型絕對偏差估計範圍從0.2%到12.9%在10數據折疊,而對於MB的模型估計範圍從0.6%到13.8%。問的美從40.1到67.5不等模型,從26.7到43.2 MB的模型。最後,RMSE範圍從56.5到131.2的本地語言模型,從33.8到151.0 MB的模型。

使用MB的模型結果,我們比較流行的糖尿病病例的觀察和預期數量每FFS NFFS醫生(表4)全省和衛生區域的練習。省和地區數據FFS醫生的結果相似,支持模型的內部效度。NFFS醫生的預期病例數是51%高於全省的觀察值。當我們檢查這些值由衛生區域,我們發現8.2%低於期望值溫尼伯衛生區域的觀測值。然而,對於剩下的衛生區域,預期值遠高於觀測值。

表4

觀察和預測平均每個服務收費的糖尿病病例數(FFS)和non-FFS (NFFS)醫生在馬尼托巴省的醫生群體

圖1顯示了糖尿病病例的比例確定在兩省每個數據源。在問,預測模型導致糖尿病病例的數量增加了37.2%確定的管理數據庫,而在MB導致增加了16.3%。在問,原油糖尿病患病率僅從醫院根據情況確定數據和FFS醫生聲稱是8.1%,而基於觀察和估計預期的情況下是13.0% (95% CI 12.9%到13.0%)。在MB,原油糖尿病患病率估計基於醫院的情況下確定數據和FFS醫生聲稱是5.6%,而估計基於觀察和預期的情況下是6.7% (95% CI 6.7%到6.8%)。

圖1

每分錢的觀察和預測糖尿病病例確定數據源和加拿大省(FFS醫療費;NFFS non-FFS)。

討論

本研究開發了一種預測模型與行政衛生數據庫評估電子醫生聲稱數據的完整性;普遍的模型應用於估計under-ascertainment糖尿病病例,但可以應用到其他慢性或急性疾病,主要是管理或在表示醫療單位治療設置。當模型應用於問加拿大省的數據,結果顯示,接近40%的糖尿病病例錯過因為NFFS醫生不接觸患者的索賠報告數據。當模型在MB外部驗證,一個省的一些NFFS醫生提交索賠,模擬結果表明,<錯過糖尿病病例的20%,但這個比例由地區差異很大;有少偏見在溫尼伯衛生區域,其中包含MB,最大的城市和更實質性偏差non-Winnipeg健康地區有更高比例的NFFS醫生。

2005年加拿大社區健康調查的數據,28一項全國性調查用於地區慢性疾病監測、顯示原油問的糖尿病患病率為6.8%和4.4%為MB人口12年以上,超過50%的差異。當我們比較粗患病率估計的兩個省隻使用FFS索賠和醫院的記錄,在問隻有8.9%高於MB。然而,調整後可能錯過的情況下使用我們的預測模型,在NL粗患病率為45.1%高於在MB,產生類似的差異評估調查數據中觀察到。

不完整的申請捕獲NFFS醫生類似於單位情況調查數據,這兩個可以偏差增加參數估計和方差估計。單位情況說明調查通常很難調整,因為無很少被研究者可用的信息。事實上,行政數據已經在先前的研究用來估計的影響調查的偏見的估計醫療使用。29日然而,我們的研究表明,使用行政數據評估調查情況說明應采取謹慎,作為行政數據庫本身可能是不完整的。

雖然提出了預測模型提供了一個有用的工具來估計偏差在疾病流行由於不完整的索賠數據,同樣重要的是要考慮如何使用其他數據庫解決差距在這些數據。電子醫療記錄也越來越多的被采用以人群為基礎的慢性疾病研究和監測研究,30.並可以代表一個重要的額外的數據來源情況確定。藥房數據庫也被用於確定31日當用於疾病治療的藥物有高特異性捕獲。

這項研究的限製包括限製組解釋變量可用來開發預測模型。殘餘混雜因素如醫師生產力,10類型的練習,甚至特點的病人被醫生可能會影響預測精度。32研究的優點包括使用驗證用例定義確定糖尿病病例和內部和外部的驗證過程。

進一步的研究將檢驗預測模型的有效性,將它應用於其他慢性疾病和其他司法管轄區;33模型的效用並不局限於加拿大管理數據,作為一個類似的方法提出了評估癌症登記數據的完整性。16模擬也可以用來評估病人的影響,醫生和衛生係統特征估計的完整性。34例如,模型假定醫生將有相同的分布特點和協會的數量普遍在FFS和NFFS人群糖尿病病例,這可能不是一個有效的假設。35

總之,這項研究表明醫生索賠數據的完整性與醫師薪酬的方法,預測模型可用於估算疾病監測數據不完備的大小。這個預測模型利用定期收集相關數據,因此是可行的實現在時間和跨司法管轄區。

確認

作者感謝馬尼托巴省健康,健康生活,老年人(重債窮國2012/2013-04)和紐芬蘭和拉布拉多衛生信息中心提供的數據。

引用

腳注

  • 貢獻者LML門將,總部,女士和KS設計分析和研究獲得的數據。JPK, XY,納米和工作進行了分析。LML JPK和納米起草手稿和所有剩餘作者閱讀和大幅修正它。所有作者前的最後一個版本的手稿提交批準。

  • 資金這項研究是由加拿大衛生研究院的研究(融資參考號123357)。LML支持了研究馬尼托巴省健康研究委員會的主席。

  • 相互競爭的利益沒有宣布。

  • 倫理批準曼尼托巴大學健康研究倫理委員會和NL衛生研究倫理委員會。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據共享聲明沒有額外的數據是可用的。