條文本
摘要
客觀的Newcomb-Benford定律(NBL)提出了一種適用於許多不同自然數據來源的第一位數、第二位數和數字組合的規則分布。在許多數據集中,測試NBL的偏差作為識別數據可信度問題的篩選工具。本研究旨在比較來自芬蘭和西班牙的公開等待名單(WL)數據,以測試NBL作為標記WL中潛在操縱的工具。
設計分析芬蘭語和西班牙語WLs第一個數字的頻率,以確定它們的分布是否與NBL記錄的模式相似。使用Pearson χ分析與期望的第一位數頻率的偏差2、平均絕對偏差和柯伊伯檢驗。
設置/參與者芬蘭和西班牙有全民健康保險和國家衛生係統,但透明度和良好治理標準水平不同。
主要指標將芬蘭和西班牙WL數據中報告的數字的觀測分布調整為根據NBL的預期分布。
結果根據所有統計檢驗,芬蘭衛生係統報告的WL數據符合第1位NBL (χ p=0.6519)2測試)。對於西班牙數據,所有檢驗均否定這一假設(p<0.0001 χ)2測試)。
結論測試與NBL分布的偏差是一個有用的工具,可以識別WL數據可信度的問題,並表明需要進一步測試。
- benford-newcomb分布
- 等候名單數據
- 捏造的數據
這是一篇開放獲取文章,根據創作共用屬性非商業(CC BY-NC 4.0)許可證發布,該許可證允許其他人以非商業方式分發、混音、改編、在此作品的基礎上進行構建,並以不同的條款許可其衍生作品,前提是原始作品被正確引用且使用是非商業性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
數據來自Altmetric.com
本研究的優勢和局限性
積極參與輪候冊管理的不同參與者之間經常發生矛盾和利益衝突。
可以使用統計工具來驗證等待列表數據的合規性。
紐庫姆-本福德定律似乎是一個有效的工具,用於篩選公共等候名單數據的可信度,並表明需要進一步分析。
本文中提出的方法可以應用於其他醫療保健數據。
簡介
等候名單(WLs)被認為是公共國家衛生服務不可避免的副作用1最近,通過比較WL指標來評估衛生係統的績效。2由於與wsdl的起源和維護相關的固有問題,醫療保健係統在管理wsdl時麵臨極大的困難。從WLs的數量中得出關於其重要性的結論並非易事,因為可靠的數據往往缺乏或隱藏,操作定義不標準且經常變化,關於患者病情嚴重程度的信息幾乎不包括在內。2管理更新和WLs的標準化雖然是必要的,但通常與WLs大小的“成功”減小有關,這與生產力的提高或更好的管理不一定有關,特別是當這種減小在沒有確保患者不再需要他/她所等待的幹預的情況下實現時。3.
在擁有公共資助的國家衛生係統的國家,大型衛生隱患會削弱公民對衛生係統及其領導人和專業人員的信心,而且衛生隱患通常被用作政治對抗的一個因素。因為WL已經成為一個相關的問題,無論是從社會和政治的角度來看,描述WL減少的數字被視為醫療政策“成功”的顯著信號,WL管理層可能更專注於提供有吸引力的短期“數字”,而不是製定與WL問題複雜性質一致的長期解決方案。因此,就像過去所記載的那樣,我們很有可能會去玩弄這些數字。4個5
與皮諾曹不同的是,大多數說謊者不會提供他們不誠實的跡象,因此需要一些方法來檢測WL數據中的操縱行為,並區分準確的數據和虛假的數據或遺漏信息的數據。最初由紐科姆描述,61938年,一位名叫本福德的物理學家重新發現了一個顯著的經驗現象7:對於以十進製形式表示的大量異構數值數據的集合,指具有d作為第一個有效數字,用d= 1,2,…,9,不是人們所期望的1/9(11.1%),而是大約等於 .根據今天所說的紐庫姆-本福德定律(NBL;或本福德的Lw或第一位數定律),前導數字為1、2或3的概率占總概率分布的>60%。盡管這一定律不適用於真正的隨機數(如彩票)、連續數字、分配數字(如郵政編碼)和有一些限製的數字序列的數據集,但許多現實世界的數據集確實符合NBL的第一位數字分布。知道了第一個有效數字的頻率應該以一種特定的方式下降,可疑的數據可能會根據這個經驗NBL分布進行統計測試,以評估其可靠性,7為篩選大量可能被操縱的數據的可信度提供了堅實的依據。
多年來,對數據集中數字頻率的分析已經成為稅務審計中檢測數據違規的強大工具,即所謂的司法審計,以檢測財務會計操縱,8 9大型審計和谘詢公司越來越多地使用這種分析來打擊財務欺詐。10 11NBL甚至因為發現希臘政府一直在向歐盟(EU)提交“虛構的”經濟數據而名聲大噪。12在醫療領域,NBL已應用於臨床問卷數據,13為了檢驗訪談數據的偽造性,14為了評估疫情期間公共衛生監測係統的表現,15癌症登記中癌症發病率的準確性16並承認科學醫學出版物中的欺詐行為17 18但是,據我們所知,盡管關於WL的管理數據在性質上與財務會計類似,但到目前為止,還沒有人使用NBL作為公共資助的國家衛生係統WL數據可靠性的“壓力”測試。
本研究的目的是比較芬蘭和西班牙對應的公共WL數據,這兩個國家都有國家衛生係統,但具有不同程度的透明度和良好治理標準,以測試NBL作為篩查WL數據中的違規行為的工具。
方法
研究設計和概念框架
根據NBL的研究,對於以十進製形式表示的大量異構數值數據集合,第一個有效數字為1的數值數據出現頻率約為30%,第一個有效數字為1,2或3的數值數據出現頻率約為60%。對於第二位數和之後的數字,NBL預測其分布更為均勻。19我們的分析檢查了西班牙語和芬蘭語的WL數據,特別是出現在第一個位置的數字的頻率,並將其與NBL分布後的預期模式進行了比較。
設置
在所有國家,公共資助的選擇性治療的WL數據並不是同樣可獲得和透明的。芬蘭於1993年首次公布了有關WLs的數據。1996年,芬蘭政府依法承認病人有權知道輪候時間以及在對輪候時間不滿意時提出投訴的可能性,並規定了獲得初級和二級保健幹預措施的具體最長時間。2005年,政府在芬蘭法律中引入了新的國家醫療保障製度。目前在芬蘭,對排隊、等待時間和醫院生產率的國家監測在過去十年中得到了加強,質量也得到了改善。這為監督機構和其他機構提供了采取行動的信息,以實現《保健保障》。20.
2003年12月,在申訴專員提出正式要求後,21西班牙開始發布在全國範圍內收集的同質數據,重點關注外科手術的患者數量和WLs持續時間。這些數據僅包括17個擁有區域保健服務的西班牙自治區14個不同保健服務機構的信息。衛生部公布的數據直到2012年6月才包括所有17種急性呼吸道感染的信息。每個谘詢中心都負責衛生規劃、信息係統和服務提供,但它們並不總是向西班牙衛生部中央當局提供有關衛生指南的信息。因此,可用的信息可以被認為是wsdl所帶來的挑戰的代理,但不是最先進的或決定性的。22盡管大多數調查人員確實向國防部提供了必要的信息,但並沒有達成將這些分類信息公開的協議。一些ac的網站上有一些區域數據,但這些數據一般不均勻。23
數據源
我們使用了從西班牙衛生、社會政策和平等部收集的關於低收入人群的公開數據24以及芬蘭國家健康和福利研究所,25分別。這兩個數據庫都提供了關於外科手術和醫學和外科專科門診就診的WLs周期性演變的官方信息。“等待就診的患者”是指在參考日期等待首次就診門診專家或擇期手術幹預的患者人數。在西班牙,報告數據的頻率是一年兩次(6月和12月),而芬蘭的數據是一年三年(4月、8月和12月)。該數據集分別包括2003年12月至2015年12月和2007年12月至2012年12月期間西班牙的764份有效觀察數據(35份清單,19-23個時間段)和芬蘭的594份有效觀察數據(14份登記冊,0例等待患者被剔除)(38份清單,16個時間段)。數據可以在線訪問補充附錄文件.
統計分析
數據會自動篩選前導數字和數字。提取的數字被傳輸到一個逗號分隔值的電子表格文件中,並使用R包確定每個數字的出現benford.analysis.26
我們使用三種不同的統計檢驗來確定一階和高階數字的分布是否符合NBL: Pearson 's χ2在原假設下,數據將遵循本福德分布。皮爾森的χ2測試是測試觀察樣品是否滿足NBL的自然候選。第一個數字的統計檢驗定義為 ,在那裏O我而且E我數字的觀察和預期的絕對頻率是多少我,分別。在H0時,統計量遵循x2用8df分布。對於特定的數字,標準正態統計量 可用於檢查觀測頻率是否明顯偏離其理論值。
因為x2測試對樣本量非常敏感,具有巨大的功率和較大的樣本量N和低功率,中等小的樣本量,我們也使用了MAD檢驗,忽略樣本量。MAD統計量計算為 .最後,第三種選擇是柯伊伯檢驗,是對Kolmogorov-Smirnov檢驗的改進。柯伊伯檢驗計算為 ,在那裏 而且 , F(.)為累計相對頻率。27
最後,我們使用Miller建議的標準測試NBL是否適用於我們的數據集28華萊士,29我們進一步重複了適應度NBL分析,但隻使用芬蘭和西班牙數據集同一時間點(12月)的數據(見在線)補充附件1).
病人參與
本研究使用了公開的數據來源,不包括患者作為研究參與者。沒有患者參與研究問題的設定、研究設計或研究的整體進行。目前還沒有讓患者參與研究結果傳播的計劃。
結果
圖1比較芬蘭和西班牙WL數據的第一個有效數字的總體頻率分布與預期的NBL頻率分布。通過目測,芬蘭的數據似乎令人滿意地調整為NBL分布,而西班牙的數據似乎根本不滿足NBL分布。
表1和表2顯示芬蘭和西班牙數據集的統計適應度的結果,本福德定律。這些結果與前麵的圖表一致,表明對於芬蘭數據,不可能拒絕原假設,即它們遵循本福德分布。然而,對於西班牙數據,零假設在所有檢驗中都被拒絕。
討論
我們的結果基本上表明,來自芬蘭的WL數據遵循NBL,而來自西班牙的數據不遵循NBL,這引起了對其可信度的懷疑。這個例子說明了如何使用統計工具來驗證WL數據是否符合一種適用於許多不同自然數據來源的規律性法則。
積極參與WL管理的不同參與者之間經常發生矛盾和利益衝突。公眾和媒體認為,定期發布的有關WLs的數據是醫療保健政策成功或失敗的精髓。因此,為了回應這些期望,數據操縱對政策製定者和管理者都是一種誘惑。目前所選的兩個國家被認為在行為上有顯著不同。芬蘭在透明度、良好治理、對政治階層的社會控製等方麵的國際排名中一直名列前茅,與其他國家相比,芬蘭更有可能對違規行為進行懲罰。在世界司法項目(WJP) 2015年法治指數中,芬蘭排名世界第四,30.在以適度的成本提供高質量的公共服務方麵被評為效率最高的國家。31此外,國際上眾所周知,芬蘭公共組織的醫療保健服務係統是一個成功的故事。32在最新的WJP法治指數中,西班牙在24個鄰國中排名第17位。2015年,它因腐敗程度高而聞名,33這種情況似乎正在惡化,在東擴前的15個歐盟國家中,僅次於意大利和希臘。在西班牙,2002年,監察專員授權發布了WL數據,該報告稱,數據稀疏、不完整,有時不太真實。2215年過去了,但即使是現在,衛生部也認識到這些數據的局限性和缺乏嚴謹性。
無論是在西班牙還是其他國家,不遵守NBL並不一定證明WL數據不準確或被操縱。NBL普遍經驗分布提供了一種工具,從數據準確性的意義上檢查數據質量,它表示計算或估計與準確或真實值的接近程度。如果將NBL後麵的真實值替換為虛構的數字,則結果通常與NBL有偏差。編造數字不一定是一種故意的操縱行為;即使是四舍五入也會導致本福德定律的偏差。因此,偏離本福德分布並不能提供操縱的確鑿證據,正如一致性並不能證明數據的幹淨。相反,不符合應該被視為一個信號,標記數據需要更仔細的檢查和進一步的測試。因此,除了現有的控製機製之外,本福德定律可以作為檢查可能的數據操縱的第一步。
在這項研究的局限性中,首先應該指出的是,我們隻分析了WL的第一個數字。在法醫分析中添加二階數字和前兩位數字組合測試是徹底的法醫檢查的重要組成部分。這應該作為與第一位數字測試不同的單獨測試來完成。當考慮的數據集包含的值太少時,會出現一個例外,在這種情況下隻執行第一位測試。如前所述,在這種情況下,建立了一個經驗閾值,以避免對任何記錄少於1000條的數據集進行二階數字檢驗和前兩位數字組合檢驗,34我們的情況也是如此。沒有正式的統計理論能夠為適用的規模提供重要的閾值點;相反,上述建議是來自處理數據集和法醫數字分析的經驗的主觀判斷。
第二,與一些限製性序列一樣,已發表的WLs可能不適應NBL分布,但在進行的初步分析中(見在線)補充附件1)分析的兩份清單似乎符合所需的要求28 29遵循這個分布。第三,來自芬蘭和西班牙的數據集存在一些差異(大小、收集時間),這可能會影響它們的分布,盡管僅使用12月收集的列表進行的分析與總體結果一致(見在線)補充附件1).最後,應該指出的是,這兩個國家都使用(合法的)行政機製來“清理”死者、已經做過手術或不想再做手術的人、無法聯係到預約或不在保險範圍內的人的WLs。此外,進入和退出WLs可能會有一些季節性變化。這些因素顯然會影響等待人數,但不應影響第一個數字的分布,也不應影響NBL分布的調整。相反,偽造的數據很難符合NBL的分布。35
本文中提出的方法可以應用於其他醫療保健數據,隻要建立了控製機製或警報信號,加強努力監測和控製衛生中心的臨床和經濟信息。其他值得關注的NBL測試領域包括不良事件報告係統、職業活動文件、手術室時間、住院時間統計和研究數據文件(臨床試驗、觀察性研究和類似數據)。
參考文獻
腳注
貢獻者JPD、BGL-V和SP構思並設計了這項研究。JPD和CG-M監督數據收集並進行統計分析。JPD起草了手稿,所有合著者平等地參與了手稿的修改和最終批準。JPD是本研究的擔保人。所有作者都可以完全訪問研究中的所有數據(包括統計分析、表格和圖表),並可以對數據的完整性和數據分析的準確性負責。
資金本文是由西班牙經濟和競爭力部資助的“應對社會挑戰的國家研究、發展和創新計劃:2017-2020年國家科學研究和技術創新計劃”下的撥款ECO2017-83771-C3-2資助的研究的一部分。
免責聲明資助者對這項研究的進行或手稿的起草沒有任何影響。
相互競爭的利益沒有宣布。
病人的同意不是必需的。
倫理批準根據西班牙法律和國際法規,該研究的二手數據可從公共來源獲得,沒有患者作為參與者,不需要倫理批準。
出處和同行評審不是委托;外部同行評審。
數據共享聲明完整的數據集(dataset .csv)在附錄中沒有限製。