條文本
文摘
目標測定的參考區間(RIs)使用大數據麵臨一些障礙由於分析器的異質性,和種族。本研究旨在建立常規的RIs常見全血細胞計數(CBC)、生物化學實驗室測試在均勻,健康,男性20多歲的朝鮮士兵使用大型體檢數據集,比較參數和非參數估計。
設計一個多中心,橫斷麵研究。
設置7在韓國軍隊醫院。
參與者總共有609 649人接受健康檢查,當2015年1月至2021年9月晉升為下士。260 889名年齡在20 - 25的合格的個人被包括在分析中。
主要結果和措施建立了RIs的參數和非參數方法。參數的方法,應用最大似然估計測量Box-Cox變換參數並在第2.5和第97.5百分位數的值被重新計算。非參數方法采用圖基的排除測試和第2.5和第97.5百分位數的值。身體質量指數也表現進行分類。
結果獲得的RIs血液學參數設備之間進行比較。如果值是一個高斯分布,參數和非參數方法匹配的血液學和生化標記。當右偏態值,上限是更高的參數與非參數方法。與肥胖參與者顯示更高的RIs CBC,一些肝功能測試和血脂水平比參與者沒有肥胖。
結論使用數據從健康,男性在20年代朝鮮士兵,我們提出了CBC的RIs和生化參數,比較參數和非參數估計。這樣的方法基於大型數據集變得更加普遍,還需要進一步的研究來區分合格的個人和確定RIs推斷樣品。
- 臨床化學
- 生物化學
- 內科醫學
數據可用性聲明
合理的請求數據。的數據支持本研究的發現可以從相應的作者或合理要求。
這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
來自Altmetric.com的統計
本研究的優點和局限性
這項研究是基於260 889名健康男性朝鮮士兵在20年代,代表最大的領域的樣本參考區間。
血液學和生物化學標記的參考區間估計和確定使用參數和非參數估計。
參考之間的間隔比較肥胖和非肥胖的人。
這項研究僅限於分析參考間隔隻有在年輕、健康的軍隊士兵。
介紹
建立參考區間(RIs)和參考實驗室標記的值是非常重要的在支持決策在臨床實踐中。1RIs廣泛估計0.025和0.975百分點,計算95%置信區間,從一個健康的人口。2當使用非參數值,根據臨床實驗室標準協會的指導方針,認為至少120健康個體需要計算90%置信區間的上、下參考範圍。然而,由於大量的數據方便的今天,基於大容量數據分析方法進行臨床實驗室醫學。3在這方麵,擴展從幾個考生實際人口克服的限製可能是有價值的,盡管適當協調的醫療記錄可能是一個挑戰。
直接抽樣法是一種傳統的方法,是指從預選的人口與測量生成RIs和決心。相反,間接抽樣選擇結果從常規病理結果在混合人口,這可能包含健康的和不健康的人在一起。適當的統計技術,如截斷最大似然方法,然後應用於確定RIs。4數據挖掘、提取和發現新信息的過程從一個大的數據量,是一種間接的方法建立RIs。然而,患病的個人不得重疊的數據,這種異質性的主要障礙之一是一個間接的方法。4
幾個現實的方法使用“大數據”已經建立了RIs的血液抽樣結果。例如,在韓國隻有一項研究評估國際扶輪為常見的全血細胞計數(CBC)在804年3 - 99歲的623人使用單一血液學的設備。5然而,不健康的受試者是否排除問題,研究隻估計CBC的值。另一個單一的“大數據”的方法在荷蘭招募了七百萬多名測試結果和嚴格分析了RIs 18常用臨床參數。6然而,他們認為一個健康的人口而不是基於臨床信息分布的測試結果。來自intralaboratory的異質性差異和人口健康和父母的混合分布計算RIs從“大數據”的挑戰。7
在這方麵,建立RIs使用大量的數據在一個均勻健康的成年群體可能是有價值的。因此,本研究旨在分析約260 000名健康的體檢數據朝鮮士兵在20年代,建議CBC的RIs和幾個化學參數,劃分樣本的身體質量指數(BMI),並比較RIs參數與非參數方法和分析工具。
方法
研究參與者
由於征兵在韓國,所有男性公民履行義務兵役並接受體檢在入伍前的軍事人力資源管理軍隊。嚴重的身體或精神疾病病例免除強製服兵役。因此,沒有重大疾病的人可能會在朝鮮軍事服務。參軍後,大約1年以後,所有的韓國士兵接受額外體檢時晉升為下士從上等兵的秩。
電子醫療記錄2015年1月至2021年9月新朝鮮武裝部隊防禦醫療信息係統數據庫提取。609 349人的醫療數據接受醫學檢查之前他們的晉升為下士在18武裝部隊醫院。醫院、三(n = 41 113)被排除在外血液學的由於缺乏信息和生化試驗設備。由於異質性分析儀器,然後排除八醫院(n = 293 799)和選擇七醫院使用相同的生化設備公司和血液學的設備從兩個不同的公司。我們選擇低概率的士兵20 - 25歲的疾病和排除13 548 < 20歲或> 25歲。最後,20多歲的260 889名健康的朝鮮士兵被包括在分析中。
知情同意放棄由於自然研究的回顧,因為使用了匿名的臨床資料進行分析。
實驗室檢測和分析儀器
收集以下血液學試驗參數的結果:血紅蛋白(Hb, g / L),血細胞壓積(Hct, %),紅細胞計數(加拿大皇家銀行,1012/ L),白細胞計數(“109/ L)和血小板(PLT, 109/ L)。XN係列(Sysmex,神戶,日本)被用於五醫院。四個使用一個xn - 1000分析器和醫院使用xn - 3000。ADVIA 2120 i(德國西門子醫療診斷、埃施博恩)是在兩家醫院使用。
結果收集下列化學參數:肌酐(mg / dL)、天冬氨酸轉氨酶(AST, IU / L)、丙氨酸轉氨酶(ALT、IU / L),γ穀酰基轉移酶(GGT, IU / L)、總膽固醇(mg / dL),甘油三酸酯(mg / dL)、高密度脂蛋白(HDL)膽固醇(mg / dL)、低密度脂蛋白(LDL)膽固醇(mg / dL)和空腹血糖。貝克曼庫爾特盟係列(美國邁阿密貝克曼庫爾特)是用來測量這些生化參數在七醫院。的醫院,四個,兩個,一個使用非盟- 480,分別au - 680和非盟- 5800。
常規實驗室外部質量控製管理程序進行了測試在朝鮮外部質量評估服務協會。所有醫院進行內部質量控製和分析設備校準符合製造商提供的說明。
RIs的計算
參數和非參數方法被用來計算血液學的的RIs和化學參數。考慮沒有共識的方法是適當畫RIs從大容量的數據,我們采用了參數和非參數方法。非參數方法應用使用的步驟類似於加拿大實驗室項目中使用的過程在兒科參考區間(卡鉗)研究8:(1)個別參數的分布圖形,初步檢查使用quantile-quantile圖和直方圖;(2)圖基的排除測試值低於q1 - 1.5×差以上第三季+ 1.5×差被排除在外,是用來識別異常值;和(3)在第2.5和第97.5百分位數的值被定義為上下極限。參數方法應用Arzideh使用先前的研究中采用的序列等9和若爾克等10:(1)一個Box-Cox變換基於核密度估計,這可能最大化似然函數,用於將數據轉換成對稱分布;(2)分布的第2.5和第97.5百分位數得到;和(3)對數轉換值然後重新計算到真正的價值。此外,根據肥胖的分類,定義的韓國社會肥胖研究指南,11:非肥胖(< 25.0公斤/米2)和肥胖(25.0 - -30.0公斤/米2)組。Mann-Whitney U測試是用來比較肥胖和非肥胖個體之間的差異。所有統計分析使用R V.4.1.2 Windows (R開發核心團隊)和軟件分析它(分析它的軟件、利茲、英國)。
病人和公眾參與
沒有病人和公眾參與。
結果
CBC參數(如乙肝、Hct、加拿大皇家銀行、“和PLT)和生化標記(如肌酐、AST、ALT、GGT、血脂和空腹血糖)中描述圖1和圖2。“和PLT計數和大多數肝功能參數(如AST、ALT和GGT)揭示了非高斯分布。血脂、甘油三酯違反了正常和呈現右偏態分布。這些分布模式確定在線補充表S1和S2。均值高於中位數為“價值,PLT、AST、ALT、GGT和血脂水平,反映出右偏態分布。
RIs的血液學檢驗確定,建立了參數和非參數方法在健康的朝鮮士兵20 - 25歲的列表表1。類似的RIs XN係列和ADVIA 2120我被觀察到在所有研究對象。“和PLT,右尾分布,在第97.5個百分位值更高參數的非參數方法。此外,在所有檢查士兵,26.4%是肥胖和分區的RIs根據BMI透露Hb的值,Hct,紅細胞,“在肥胖和PLT高於非肥胖者(p < 0.001)。這種程度的差異無論分析設備和方法。
常見的化學考試的RIs建立健康的20多歲的朝鮮士兵根據總結了參數和非參數方法表2。參數方法RIs高於AST的非參數方法,ALT、GGT和甘油三酸酯水平。一些血脂水平(例如,總膽固醇、甘油三酯和低密度脂蛋白膽固醇)更高肥胖比非肥胖士兵(p < 0.001),而高密度脂蛋白膽固醇水平降低肥胖士兵(p < 0.001)。
討論
目前的研究檢查大量的數據從260年的血液學的生化實驗室檢測889名健康20 - 25歲的朝鮮士兵的個人機密肥胖狀態。參數和非參數方法被用來計算RIs。在研究期間內,觀察無顯著差異。分析設備和人口穩定在研究期間。然而,數據的分布在七個醫院不等於(在線補充圖1)。在CBC的測試中,估計RIs之間類似的參數和非參數方法。估計RIs顯示之間的一致性分析儀器,和肥胖與血液學的RIs的測試的區別。一些化學標記的上限價值更高參數的非參數方法。這可能源於右偏態分布的原始數據,圖基的測試不包括一係列的數據正確的尾巴。此外,我們表明,生化參數的RIs肥胖和非肥胖個體之間的不同。
這項研究是最大的建議RIs,堅強的評估一群十幾成年人的一個20多歲的種族。研究期間內的所有士兵,大約2%是多元文化。12考慮超過3000個人被要求獲得的RIs每十年生活在20年代,30年代和40年代,13有一個缺乏數據建立RIs的20多歲的年齡組人口眾多。當前的結果從大量樣本中可能是有利的,考慮到樣本過小可能會產生選擇性偏差14這估計人口的RIs的變化在很大程度上是受到樣本容量的影響。建立了RIs的大數據的方法與以前的結果一致。
分析使用的數據集使用的加拿大衛生措施調查常見的非參數秩方法建立RIs血液學的參數和顯示為Hb比較值,Hct、紅細胞,“和PLT與當前的研究。15的分區,我們觀察到的RIs血液學的肥胖的價值高於非肥胖者。一些研究支持這一觀察,連接肥胖、促炎細胞因子和紅細胞生成增加。腰圍呈正相關,Hb、Hct、加拿大皇家銀行、“PLT。16一個全國性的以人群為基礎的隊列研究表明高Hb水平與增加或代謝綜合征。17我們也獲得了積極的BMI和所有檢查血液病學的指數之間的相關係數p < 0.001(數據未顯示)。考慮到預測模型提出了一個增加的趨勢在韓國成年人肥胖,估計有62%的男性會肥胖,到2030年,18仔細解釋的實驗室檢測體重指數可能是必要的。
建立了RIs的AST、ALT、GGT、總膽固醇、甘油三酯、低密度脂蛋白膽固醇和肥胖的空腹血糖水平高於非肥胖,而高密度脂蛋白膽固醇降低肥胖參與者。肝酶水平升高與肥胖相關聯的成年人口。19然而,由於多個實驗室的變化在正常肝酶水平的上限,RI根據嚴格定義參考人口應該建立由不同的分析器。20.本研究同意以前的報告關於血脂水平,總膽固醇,低密度脂蛋白膽固醇和甘油三酯在肥胖水平高於非肥胖者。21因此,它可能是合理確定RIs肝功能測試和血脂水平基於個人的臨床狀況。
引入了一個大的數據驅動的方法確定RIs臨床實驗室醫學好幾年了。大醫療數據的應用也促進了生物信息學的發展,精密醫學,公共衛生信息學和人工智能成像。22使用存儲實驗室結果在數據可用性方麵有優勢。這個優點讓從特定人群更容易收集數據。例如,泰勒等23表明RIs的危重患者明顯不同於那些在健康門診病人,表明謹慎決策基於RIs的重症監護室從健康的控製。另一個優點在於RIs從大數據的代表性。一個真正的大量的研究參與者可能允許代population-representative引用限製。加拿大全國代表性健康調查了11 999樣品3 - 79歲以上的老人,和健壯的RIs跨越從兒童到老年人提取。15
然而,存在一些障礙在估計RIs時使用大數據。這種方法並不能保證高質量的RIs由於混合,不完整的臨床資料。介紹了幾種統計方法來改善RIs的可靠性。例如,阿默爾等24開發了煉油企業算法,它可以自由訪問下載開源R包。其他方法,如kosmic算法25或截斷最小χ2方法,26可能改善generalisability從實際數據計算RIs的間接方法。此外,數據使用的間接方法可能涉及噪音。27它可能是非常具有挑戰性的從父母的個人獨立的健康。個人之間的交點可以確定使用Box-Cox轉換後核密度估計,10在當前的研究中采用。雖然年齡的範圍覆蓋在這項研究中隻有6年,研究參與者可能健康的人。我們使用從門診健康體檢數據,推薦,因為這個示例選擇可以減少患者在急性病理生理條件的報名。14
國際扶輪的方法測定,直接和間接的方法已經被使用。直接法計算RIs從預定義的健康個體,是否選擇之前收集血液樣本,先天的,或後,後驗。真正的隨機很重要在這個方法中,但需要大量的成本,時間和精力來表示目標人群。一般來說,直接法新兵少量的人口,這可能導致選擇性偏差。4間接法從一個混合選擇大量的個體人口,也可能包含不僅十幾,患病的個體,RIs基於魯棒統計方法和措施。4因為該方法不能選擇健康個體使用預先確定的特定標準,個體患病或者處於亞臨床狀態可以影響RIs。在這方麵,個體在當前的研究中是數量大,不太可能有疾病和一個競賽。這可能有利於結合直接和間接方法的優點。
本研究也有一些局限性。首先,因為隻有健康的軍隊士兵在20多歲被包含在分析中,數據分類根據參數,比如年齡、性別或種族並不可行。第二,盡管個體在當前的研究中被認為是健康,噪音由於未被發現或亞臨床健康狀況可能存在。例如,在入伍士兵是健康的,但一種疾病可能發生在體檢之前。第三,考試CBC微分概要文件沒有執行。盡管這些限製,足夠大的樣本容量,研究顯示CBC和常見的臨床化學參數的RIs健康的20多歲的韓國男人。考慮樣本容量規劃是原油在很多研究中得到驗證28和幾個障礙招募合適的參與者可能會阻止一個足夠大的樣本容量,這個研究績效提供RIs均勻健康的年輕人充分使用大樣本和顯示不同的RIs的血液學的標記和常見的肥胖和非肥胖個體之間的化學測試。
結論
通過分析大樣本大小健康的士兵,我們建議CBC和常見的臨床化學參數的RIs均勻20多歲的韓國男人使用參數但非參數方法。我們觀察到的差異的RIs血液學標記和常見的生化檢測肥胖和非肥胖個體之間,和臨床醫生應該謹慎地解釋測試結果根據人體測量值。
數據可用性聲明
合理的請求數據。的數據支持本研究的發現可以從相應的作者或合理要求。
倫理語句
病人同意出版
倫理批準
研究機構審查委員會批準的協議是武裝部隊的醫療命令(憑借韓國;afmc - 202109 -人力資源- 064 - 01)和依法進行了赫爾辛基宣言的原則。所有的程序都按照指導方針和有關規定執行。知情同意放棄由於自然研究的回顧,因為使用了匿名的臨床資料進行分析。
引用
腳注
貢獻者TK:構想、方法、軟件、正式的分析、調查、數據管理、寫作——初稿準備、可視化。HC:驗證。SML:項目管理和寫作——審查和編輯。所有作者大幅修訂,評論和批準最後的手稿。TK充當擔保人。
資金這項研究是支持出版的2021年的研究資助Yangsan釜山國立大學醫院。
相互競爭的利益沒有宣布。
病人和公眾參與病人和/或公眾沒有參與設計,或行為,或報告,或傳播本研究計劃。
出處和同行評議不是委托;外部同行評議。
補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。