條文本

群簡介
NeuroBlu,電子健康記錄(EHR)可信研究環境(混亂關係)來支持精神衛生保健與真實的數據分析beplay体育相关新闻
  1. Rashmi帕特爾1,2,
  2. 很快南小1,
  3. Rajagopalan Ramaswamy1,
  4. 忙於習慕蘭Thadani1,
  5. Jesisca Tandi1,
  6. Ruchir Garg1,
  7. 內森Calvanese1,
  8. 馬修Valko1,
  9. 約翰·拉什3,
  10. 米格爾E Renteria1,
  11. Joydeep Sarkar1,
  12. 斯科特·H Kollins1,4
  1. 1Holmusk技術公司,紐約,紐約美國
  2. 2精神病學係的研究,倫敦國王學院精神病學研究所的心理學和神經科學,倫敦、英國
  3. 3路邊石顧問有限責任公司,聖達菲,新墨西哥美國
  4. 4杜克大學醫學院的,達勒姆,北卡羅萊納美國
  1. 對應到Rashmi Patel博士;rashmi.patel在}{holmusk.com

文摘

目的NeuroBlu是一個真實的數據(RWD)存儲庫,其中包含鑒定電子健康記錄(EHR)數據從我們的精神衛生保健提供者操作MindLinc EHR係統。beplay体育相关新闻NeuroBlu使用戶能夠通過一個安全的基於web的界麵執行統計分析。結構化數據可供社會人口特征、心理健康服務聯係人、住院、國際疾病分類ICD-9 / icd - 10診斷、處方藥物,精神疾病家族史、臨床全beplay体育相关新闻球Impression-Severity和改進(CGI-S / CGI-I)和全球評估功能(GAF)。進一步加強數據集,應用了自然語言處理(NLP)工具來獲取精神狀態檢查(MSE)和社會/環境數據。介紹NeuroBlu的開發和實現,程序維護數據完整性和安全性和數據集如何支持生成真實的證據(RWE)的心理健康。beplay体育相关新闻

參與者2021年7月31日,562年940人(48.9%)出現在數據集的平均年齡33.4歲(SD: 18.4年)。最常見的診斷記錄是物質使用障礙(1 52 790名患者),重度抑鬱症(1 120例29日)和焦慮症(1 03 923名患者)。隨訪持續時間的中位數是7個月(差:1.3到24.4個月)。

發現到目前為止數據集支持流行病學研究證明增加精神病住院治療的風險和減少抗抑鬱共病物質使用障礙患者治療效果。它也被用來開發數據可視化工具,以支持臨床決策,評估比較藥物的有效性,得出模型預測治療反應和發展NLP應用程序從非結構化EHR獲得臨床信息數據。

未來的計劃NeuroBlu數據集將進一步更好地理解相關因素分析臨床療效不佳,治療反應和預測分析工具的發展,可能被納入源EHR係統支持實時臨床決策提供精神衛生保健服務。beplay体育相关新闻

  • 精神病學
  • 衛生信息學
  • 流行病學

數據可用性聲明

數據可能會從第三方獲得,不公開。通過NeuroBlu鑒定數據可以分析平台(https://www.neuroblu.ai/)。我們強烈鼓勵協作和個人、學術機構、醫療服務提供者和商業組織希望分析的數據集來支持精神衛生研究和通知醫療政策和臨床實踐。beplay体育相关新闻請電子郵件info@neuroblu。訪問NeuroBlu ai進行進一步的信息。

http://creativecommons.org/licenses/by-nc/4.0/

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • NeuroBlu數據集樣本量大,受益於鑒定電子健康記錄(EHR)數據從560多000人獲得精神衛生保健的21年。beplay体育相关新闻

  • 數據集是建立在一個健壯的deidentification管道和加密安全框架,使廣泛的用戶分析數據通過一個可信的研究環境中使用圖形用戶界麵或先進的分析軟件(R和Python)。

  • 臨床嚴重程度結構化數據(臨床全球Impression-Severity (CGI-S))對超過80%的病人被記錄在數據集。自然語言處理(NLP)允許訪問從非結構化文本數據自由豐富的臨床數據的一部分精神狀態檢查和社會因素等純粹的結構化臨床數據集通常可用的索賠或隨機對照試驗數據。

  • 隨著數據集在現實世界的電子健康檔案數據,一些變量記錄社會人口和臨床特點是不完整的。然而,高畢業率CGI-S使得衍生發展的措施,在某些臨床數據是不完整的。使用時從臨床中提取信息文本,NLP模型可以產生假陽性和假陰性。因此,下遊NLP-derived電子病曆的數據的分析需要考慮NLP錯誤率。

  • 醫療服務提供者使用MindLinc EHR係統的數據是可用的。這意味著在其他急性臨床數據交互綜合醫學和初級保健設置不可用和記錄的共病一般醫療條件可能是不完整的。

介紹

精神障礙導致大量全球疾病負擔的影響全世界約10億人。1在美國,大約20%的成年人有精神疾病大流行在年輕的成年人(29.4%)和女性(24.5%)。2約1300萬美國成年人患有嚴重精神疾病(SMI)和65.5%在2019年接受了心理健康治療。beplay体育相关新闻2重度精神病患者有顯著減少壽命3和生命周期成本與重度影響估計是185萬美元/人。4物質使用障礙與巨大的疾病負擔在美國(1460.3殘疾調整生命年每100人000人)。5有精神障礙患者治療的重大障礙。大約10.3%的美國成年人精神疾病沒有醫療保險,57.2%在2020年沒有得到治療。6

日益普及的現實世界的電子醫療數據集,稱為實際數據(RWD),改善了一係列醫學疾病的理解人口水平7促進了發展8和評估9的新療法。RWD可能分析生成真實的證據(RWE)量化治療幹預措施的安全性和有效性。RWE的一代代表的大規模數據集的分析醫療服務提供程序設置提供了一個互補的數據來源與更多的對照臨床試驗,可以支持新的治療方法的評估和批準。10RWE還可以用來指導決策為衛生保健提供者和納稅人,因為它更準確地代表著某些治療用於日常保健和相關的結果。11

電子健康記錄(EHRs)使臨床醫生記錄患者的臨床評估和治療途徑和代表RWD的豐富來源,可以做為補充介入研究和支持證據生成更好的描述疾病和開發和提供更有效的治療。12電子健康檔案數據集以前支持RWE代在急救護理13基於公共數據模型和基礎設施14了使研究人員能夠安全地分析RWD。15日16原則上,這些數據源也可以是有價值的工具來改善精神衛生保健。beplay体育相关新闻

但是,與身體保健,有相當大的挑戰的應用RWE支持精神衛生保健知識的一代。beplay体育相关新闻17首先,精神衛生beplay体育相关新闻保健數據通常是基於臨床評估的患者僅限於診斷代碼和主觀的,非標準化臨床協議的印象。症狀量表不記錄在日常臨床實踐。第二,幾乎沒有可靠和有效的目標生物標誌物數據支持精神障礙的診斷或治療。18第三,大多數臨床精神醫療電子病曆存儲非結構化數據自由文本,beplay体育相关新闻需要重新編碼成結構化數據被分析。同理,幾乎沒有標準化EHR不同心理衛生保健提供者之間的數據結構。beplay体育相关新闻因此,迫切需要改進的可用性量化RWE來自心理健康EHR的數據來支持更好的理解與臨床結果相關的因素,開發更有效的治療和評估,改善獲得及時、有效的精神衛生保健。beplay体育相关新闻

到目前為止,一些鑒定心理健康電子健康檔案數據集已經策劃支持大beplay体育相关新闻規模的人口研究,月19 - 21日基因組學研究提供臨床表型數據22並與潛力開發風險預測工具支持臨床決策。23日自然語言處理(NLP)開發工具支持非結構化自由文本的自動分類電子醫療紀錄並啟用詳細的臨床表現症狀等數據的統計分析,27環境因素28和臨床的情緒。29日NLP基礎設施曾被應用於非結構化身體健康電子健康檔案數據和提供給研究人員通過一個公共數據模型。30.然而,許多現有的心理健康電子健康檔案數據集隻能beplay体育相关新闻通過臨床基礎專業學術健康科學中心的研究人員。31日使更廣泛的訪問,同時保持健壯的數據隱私和安全標準,可以大幅提高的影響鑒定電子健康檔案數據集RWE代改善精神障礙患者的臨床結果。

本文提出一種隊列NeuroBlu平台的配置文件,32一個可信的研究環境,使安全鑒定電子健康檔案數據的分析從美國心理衛生保健提供者,包括先進的NLP軟件從一種文本描述精神狀態信息,beplay体育相关新闻33一個圖形用戶界麵,允許用戶從一個廣泛的背景支持精神衛生RWE代執行統計分析。beplay体育相关新闻

隊列描述

參與者和設置

NeuroBlu平台允許用戶分析鑒定數據從超過60 000名患者接受護理從25美國心理衛生保健提供者MindLinc EHR係統運作。beplay体育相关新闻在線補充eTable 1提供詳細的位置,類型的精神衛生保健服務和為每個供應商數量的患者。beplay体育相关新闻總之,平台包括鑒定EHR數據從個人接受精神衛生保健門診,住院,遠程醫療和住宅保健設施在12個美國跨越21年(1999年至2020年)。beplay体育相关新闻

MindLinc EHR係統是杜克大學醫學中心的開發,使精神衛生保健專業人員,記錄臨床資料,同時提供常規病人護理。beplay体育相关新闻34MindLinc包括結構化字段來記錄社會人口數據,診斷,藥物和臨床結果尺度以及一種自由文本字段記錄的精神狀態檢查(MSE)和治療計劃。33鑒定MindLinc EHR數據的一個子集生成(使用後來描述的數據管道)支持NeuroBlu的二次分析。

數據管道

遵守健康保險攜帶和責任法案(HIPAA, 1996), MindLinc EHR數據在源鑒定被轉換和正常化雲美國亞馬遜網絡服務(AWS)數據倉庫和映射到一個公共數據模型創建一個統一的數據集,包括數據從所有參與醫療服務提供者(在線補充eFigure 1)。NeuroBlu用戶分析統一數據集在一個基於Web的可信的研究環境,分析可能與執行統計分析工具在一個安全的基於雲的環境中運行,不允許直接訪問原始數據。35這樣,鑒定EHR數據可以分析任何訪問可信的研究環境,而無需任何運動或披露的基礎數據。

Deidentification過程

MindLinc EHR數據從源鑒定(即每個參與的醫療服務提供者)的計算基礎設施內使用安全港的方法(在線補充eFigure 1,步驟1)。36現在,該方法消除了18種識別信息充分、準確地保護所有的信息有可能確定一個病人在數據集。這包括名字,所有地理細分比國家小,所有元素的日期與個人直接相關(如出生日期、訪問日期等),電話號碼,車輛標識符和序列號,傳真號碼、設備標識符和序列號,電子郵件地址,統一資源定位器(url),社會安全號碼,互聯網協議(IP)地址,醫療記錄數字,生物標識符,健康計劃受益人數字,正麵的照片,帳號、證書/許可證號碼和其他獨特的識別號碼,特征或代碼。這些受保護的物品通過直接刪除處理,適用(如名稱和具體日期)或通過轉換麵具敏感數據,同時保留其統計和分析價值(如隨機試驗標識,記錄在歲和收集郵政編碼的前三個數字人口大於000)。

將鑒定EHR數據從醫療服務提供者獲得AWS雲

鑒定EHR數據壓縮和傳輸從源醫療服務提供者通過虛擬私人網絡安全文件傳輸協議的網站(在線補充eFigure 1,步驟2)。數據然後轉移到一個安全的Amazon Elastic Compute Cloud (EC2) AWS實例(在線補充eFigure 1,步驟3),他們在哪裏解壓和組裝加載到PostgreSQL數據庫(在線補充eFigure 1步驟4)。

鑒於MindLinc數據庫的關係性質,產生的文件EHR數據deidentification和出口流程保持關係結構中,病人的數據存儲在多個表,可以使用一個獨特的聯係在一起,隨機生成的標識符。deidentification過程是不可逆的,防止reidentification的數據,但使數據從數據庫的不同部分連接在個別病人的水平。這有助於下一步的數據管道組裝來自不同數據源的數據在一個公共數據模型(在線補充eFigure 1,步驟4),在第一節的進一步描述在線補充材料和eFigure 2

NLP管道提取MSE和社會曆史數據

MSE是一個關鍵組成部分的精神評估期間臨床醫生評估個人的臨床表現的評估。MSE特性可能會觀察到在臨床評估(如外觀和行為)或通過直接詢問或可能引起認知任務的表示。臨床表型數據的MSE提供了豐富的來源,正是表現症狀的性質,可與不同的臨床結果和對治療的反應有關。

MindLinc EHR包括半結構式的狀態評估領域中,臨床醫生與病人的MSE可以文檔特性相關。狀態評估領域允許臨床醫生選擇預定義的功能從選項列表和/或非結構化自由文本文檔。然而,預定義的功能不充分捕捉MSE不同個體之間的複雜性和可變性和臨床醫生主要作為自由文本文檔MSE特性。臨床評估每個病人的平均百分比記錄MindLinc預定義的特征是0%,而非結構化自由文本的平均比例是67%。

NLP是人工智能的學科的分支處理天然的人類語言,包括技術,實現特征的自動提取和分類從非結構化自由文本,否則將難以實現手動提取通過閱讀大量的文本。NLP心理健康EHR的應用數據通常涉及一係列的流程開beplay体育相关新闻發可以識別的算法具有臨床意義的概念進行二次分析。這些過程包括:(1)數據組裝:識別相關文檔的集合(語料庫),(2)注釋:臨床專家標注語料庫進行分類的選擇有意義的特性來生成一個訓練集開發NLP模型和一組參考評估其性能(3)預處理:準備NLP模型發展包括語料庫的停止詞刪除,阻止,lemmatisation詞性標記,(4)featurisation:文本分類語料庫中為不同的功能(如詞類、詞向量或嵌入的,情緒或時間特性)和(5)分析:發展NLP算法使用基於規則的使用訓練集或機器學習方法。由此產生的模型評估之前注釋,伸出參考集和優化最大化通過精密測量精度(陽性預測值),回憶(靈敏度)和F1度量(精度和召回的調和平均數)。37如果開發足夠精確的模型,他們可以應用於整個語料庫來生成結構化數據感興趣的臨床有意義的功能27支持精神衛生RWE的一beplay体育相关新闻代。28 38-42NLP模型也被調查作為一個潛在的方法來篩選社交媒體數據識別自殺的風險。43

NLP工具之前已經開發出了從非結構化MindLinc MSE數據提取臨床特征。NLP管道的細節和精度統計之前出版。33總之,深入學習,long-short-term內存(LSTM)方法被用來開發NLP應用程序提取241年27 MSE功能類別。應用程序運行在鑒定電子健康檔案數據集來創建一個表NLP-derived MSE的措施,這可能是加入並與其他結構化臨床和社會人口數據分析在NeuroBlu數據集。除了MSE數據,NLP應用程序開發環境中提取數據壓力作為社會曆史的一部分。進一步的信息的結構NLP-derived非結構化數據中提供的數據部分。

數據變量

全部細節可用的數據變量及其結構內NeuroBlu MindLinc數據集提供了第二節在線補充材料。變結構的數據來源於源MindLinc EHR的結構轉換為一個關係數據庫,這可能是在前端使用預定義的數據庫查詢接口訪問或通過R中的嵌入式SQL查詢腳本(隨後描述)。

結構化數據

數據集包括結構化社會人口數據在性別、出生年份、種族、種族,我們居住的狀態,婚姻狀況、就業狀況和教育的曆史。社會人口數據可能會加入結構化臨床數據代表在其他表內的數據集,包括接觸精神衛生服務的數據,急診、住院、國際疾病分類ICD-9 / icd - 10診斷、處方藥物和精神疾病家族史的記錄。beplay体育相关新闻數據結構等級量表也可用,包括臨床全球Impression-Severity (CGI-S),44臨床全球Impression-Improvement (CGI-I),44全球的評估功能(GAF)45和內在蒙哥馬利抑鬱量表(MADRS)。46

結構化應用等級量表在臨床醫生的自由裁量權,他們在每個病人遇到沒有完成,這限製了他們的可用性在NeuroBlu MindLinc數據集。結構化問卷數據可用於以下數量的病人在數據集:

  1. CGI-S: 4 71 256名患者(83.7%)。

  2. CGI-I: 3 61 819例(64.3%)。

  3. GAF: 3 895例(55.3%)。

  4. MADRS: 1126例(0.2%)。

高畢業率的數據集的好處CGI-S但低畢業率的其他等級量表。此外,CGI-S數據並不總是記錄在每個病人遇到和分數可能波動,很難解釋。為了解決這些局限性,派生的分數已經實現估計MADRS總分(基於相關性CGI-S)通過插值和平滑CGI-S數據。這種技術使MADRS得分時估計是不記錄和CGI-S分數被估計在臨床遇到不記錄,多個成績記錄在同一訪問。第二節提供了這些方法的詳細信息(iii)在線補充材料

非結構化數據

除了上述結構化社會人口和臨床,NLP(前麵描述的)的應用程序已經應用於社會曆史和MSE提取數據從非結構化自由文本記錄MindLinc EHR的臨床醫生。全部細節在NeuroBlu NLP第二節中提供應用程序(i)(外部壓力/社會曆史)和2 (iv) (MSE)在線補充材料。信息在NLP模型開發和MSE分類錯誤率也NeuroBlu平台提供的用戶指南。

總之,數據可以在外部壓力作為社會曆史的一部分包括困難與社會和家庭關係、重大生活事件,涉嫌濫用的曆史,環境問題,財政困難,住房問題,法醫曆史,在學校和就業困難問題。這些因素已經被證明與患精神疾病的風險和提供重要的上下文的其他社會人口和臨床因素與結果之間的關係。47維護數據安全和保密,原非結構化EHR數據不能用於分析。社會曆史/外部壓力和均方誤差數據,隻有數據導出使用NLP NeuroBlu可供分析的平台。

NLP-derived MSE數據被表示為241二進製變量(表示一個特定功能的存在與否)的27類:不正常的或精神的思想;影響;外觀;協會;注意/濃度;態度;認知;執行能力;基金的知識;步態和站; homicidal; impulse control; insight; intelligence; judgement; language; level of consciousness; memory; mood; orientation; psychomotor; reasoning; sensorium; sleep; speech; suicidal and violent thoughts. The default category for each value is, ‘no issues’ (or equivalent) and represents the most frequent label. Where a clinician documents an abnormality, this is represented by a specific descriptor within a particular category which is derived from unstructured text using NLP. More than one variable may be present within each category to describe multiple clinical features.

NLP-derived數據可能在個別病人級別加入使用日期的數據記錄。這使我們能夠分析非結構化數據和結構化數據記錄在同一日期或在一個特定的時間窗口(例如,14天內記錄入院診斷日期或之後)。使用這種方法,可以生成豐富的臨床表型的社會因素和心理狀態,可以對治療風險敞口和臨床結果進行了分析。例如,選擇一群患者診斷為精神分裂症和著名認知或陰性症狀可能有不同的表現型和對治療的反應的患者相比突出積極的精神病症狀。48使用這些數據可以幫助開發更好的理解潛在的病理生理學,超越了傳統的診斷分類和識別患者群體可能受益於特定的症狀領域新興的治療目標。

NeuroBlu前端接口

通過身份驗證的用戶可以訪問NeuroBlu通過一個安全的網絡接口(https://app.neuroblu.ai/)。接口包含四個關鍵要素:(1)群建築工人,(2)類別映射器,(3)數據瀏覽和(4)R / Python代碼引擎。這些元素允許用戶定義一個人口群體基於指定包含/排除標準,定義中的關鍵變量檢查隊列使用描述性統計和圖表和執行更詳細的推論統計和預測分析使用R或Python,開源統計分析軟件包中經常用到的醫療數據的研究。

群體構建器

在群體構建器,用戶可以指定包含和排除標準篩選數據集到一個特定的隊列(圖1)。第一次接觸臨床的標準可能包括年齡,性別,種族,暴露於精神科藥物和精神病學的診斷。包含/排除標準,應用描述性統計在社會人口和可用性的數據隨著時間的推移和臨床嚴重程度(CGI-S和住院比例)是動態更新。這使用戶能夠迅速評估人口特點和可用性的數據為一個特定的隊列。

圖1

NeuroBlu隊列Builder說明女性患者的人口特征診斷出患有創傷後應激障礙(PTSD)收到了舍曲林的人。

類別映射器

類別映射器允許用戶重新編碼個體變量到新的類別,可後來被稱為統計分析使用R / Python代碼。例如,連續年齡可以記錄為離散年齡樂隊和個人藥物可以記錄到大類別(在線補充eFigure 3)。這使得用戶預定義變量統計分析而不必重複相同的代碼來計算新變量在每個R / Python腳本。相同的映射可用於單獨的軍團,以確保在不同的分析統計方法的重現性。

數據瀏覽

總結整個數據集的數據瀏覽伴隨數據集提供的規格描述的數據結構(在線補充eFigure 4)。每個表的前50名行可以在數據瀏覽器允許用戶了解數據結構和元素在每一行來促進發展的表連接組裝在個別病人臨床資料的水平。然而,它是不可能出口或下載任何數據集的一部分從安全的基於web的界麵。

R / Python代碼引擎

NeuroBlu使用戶能夠執行自定義數據組裝和R / Python代碼分析引擎(圖2)。包含一個基於web的平台代碼編輯器建立一個數據組裝/分析管道,a控製台查看R / Python代碼的執行文件管理器在分析項目管理和執行不同的腳本,和一個查看器輸出提供的表格和圖形輸出R / Python代碼分析。之前定義的隊列並從隊列Builder變量和分類映射器可以直接分析腳本。輸出的統計分析可以導出為逗號分隔值(CSV)文件(表)或PNG / JPG文件(圖)。R / Python代碼引擎包括常用的R / Python包以及三個自定義R / Python包旨在支持NeuroBlu數據的分析:(1)NeuroBlu:效用函數簡化數據組裝流程使用預先構建的SQL查詢,(2)SurvBlu:一個框架進行比較分析和(3)CompEffecBlu:一組功能設計進行比較對藥物數據有效性的研究。NeuroBlu也提供了幾個模板腳本促進通常執行數據程序組裝和想象等數據。

圖2

NeuroBlu R引擎包含一個代碼編輯器,控製台,文件管理器和輸出查看器來執行數據組裝和統計分析。一個類似的Python代碼引擎也可以。MDD:重度抑鬱症

數據隱私

HIPAA法規下,美國衛生保健提供者記錄和儲存個人醫療信息提供治療的目的,計費數據,支持醫療服務操作。鑒定數據可以用於二次分析。

數據安全

NeuroBlu平台的數據中心安全框架符合網絡安全(CIS)基準,它記錄了行業最佳實踐安全配置係統,軟件和網絡。平台符合CIS級別2的操作係統(OS)級別的安全部署,這是通過收集管理和執行。對數據加密,通過平台與TLS1.2加密所有數據傳輸中的與AES256靜止數據都是加密的。

確保NeuroBlu帳戶和訪問安全、NeuroBlu平台開發安全軟件開發生命周期過程。通過ISO27001-certified流程定義和實施信息安全管理體係。用戶訪問身份驗證是通過一個訪問控製列表執行平台維護的應用程序。

參與者的特征

描述性統計的NeuroBlu數據集獲得2021年7月31日。總共有562 940人(48.9%的男性)出現在數據集的平均年齡33.4歲(SD: 18.4年)。絕大多數的人口是白人(49.1%)。在線補充eTable 2和eFigure 5提供一個完整的人口的種族。到19歲的兒童和青少年占28.7%的數據集,工作年齡的成年人(20 - 59歲)占62.2%和成人60歲以上占9.1% (在線補充eTable 3 / eFigure 6)。

在線補充eTable 4圖3說明精神障礙的患病率在數據集。最常見的診斷記錄是物質使用障礙(28.1%),其次是重度抑鬱症(23.7%)和焦慮障礙(19.1%)。的性別分布提供了診斷在線補充eTable 5和eFigure 7。這些數據顯示的頻率更大物質使用障礙,精神分裂症和兒童注意力缺陷多動症(ADHD)男性患者和癡呆和阿爾茨海默病的頻率更大,雙相情感障礙,重度抑鬱症和焦慮症患者。組成提供了診斷代碼在線補充eTable 6

圖3

精神障礙的患病率NeuroBlu數據集。

在線補充eTable 7和eFigure 8提供一個故障我們居住的狀態。最常見的美國住宅的科羅拉多(23.0%)、紐約(18.9%)、密蘇裏州(18.1%)和北卡羅萊納(13.9%)。

均值CGI-S得分記錄所有的臨床診斷提供了訪問在線補充eTable 8和eFigure 9。最偉大的意思是CGI-S分數在分裂情感性障礙患者被發現(SD, 4.48: 1.42)和精神分裂症(SD, 4.44: 1.44)最低的平均評分記錄在物質使用障礙患者(SD, 3.61: 1.80)。進行進一步分析患者至少兩個記錄CGI-S成績估計的平均最大和平均最低得分(eTable診斷在線補充eTable 9圖4)。均值之間的差異最大和最小CGI-S得分是最低患有癡呆和阿爾茨海默氏症。這可能反映了普遍的和進步的本質癡呆與情緒相比,焦慮和精神疾病,通常在事件之間的特點是時間的緩解。

圖4

全球Impression-Severity平均最大和平均最低臨床診斷(CGI-S)得分。

患者的數量至少有一個醫院訪問(住院或急診)診斷(eTable在線補充eTable 10和eFigure 10)是最大的分裂情感性障礙患者(56.7%)、精神分裂症(55.7%)和癡呆和阿爾茨海默氏症(52.2%)反映出這些疾病的嚴重程度導致的風險增加精神病住院治療與其他精神障礙。

NLP-derived MSE數據得到三個臨床領域:妄想和幻覺,情緒和認知。這些領域被選為他們代表了關鍵的臨床特征,這可能是經驗豐富的在一個廣泛的精神疾患。構成NLP為每個域定義在應用程序在線補充eTable 11。三個變量為每個域創建定義為每個域內的存在至少一個功能在任何時候在個體的臨床記錄。這些變量的故障診斷提供了在線補充eTable 12圖5。妄想和幻覺是最常見的記錄在精神分裂症患者,分裂情感性障礙,雙相情感障礙和癡呆和阿爾茨海默病,符合這些障礙的影響思維內容和感覺。情緒的特征是廣泛記錄的所有精神障礙,但在較小程度上患有癡呆和阿爾茨海默氏症。特性相關的認知是最常見的記錄在患有癡呆和阿爾茨海默病以及患有精神分裂症和分裂情感性障礙,反映出這些疾病的重要性認知症狀。

圖5

比例的患者至少有一個自然語言處理(NLP)派生的精神狀態檢查(MSE)特性診斷。

在線補充eFigure 11提供了一個分布的臨床遇到的總數(訪問)每個病人。患者平均五個訪問記錄(2 - 20差:訪問)。在線補充eFigure 12提供了一個可用的總隨訪持續時間分布數據集內的每個病人,平均隨訪時間為7個月(IQR: 1.3 - -24.4個月)。

數據在所有患者年齡。數據缺失以下變量:

  1. 性別:1572例(0.23%)。

  2. 種族:1 86 517例(33.1%)。

  3. 精神疾病診斷:66 064名患者(11.7%)。

  4. 狀態:21 919名患者(3.9%)。

  5. NLP-derived MSE數據:1 32 690名患者(23.6%)。

病人和公眾參與

患者沒有參與開發隊列的數據集或報告概要。

發現到目前為止

NeuroBlu平台和MindLinc電子健康檔案數據集被用來生成RWE通過大規模的心理健康流行病學研究以及開發自動化NLP,數據可視化和預測基於現實世界的EHR的數據分析工具。beplay体育相关新闻

精神障礙的流行病學

物質使用障礙患者的數據進行了分析探討少數民族人群的影響49並演示了利率的增加兒童和青少年精神病住院治療50成年人和精神並發症的風險增加,住院和物質使用障礙。51

結構化臨床量表數據的可用性使協會的分析精神藥物與臨床結果。分析抗抑鬱藥物單藥治療的抑鬱症患者治療後發現了一個顯著減少CGI-S但不改進的共病藥物使用或焦慮障礙患者。52增加第二代抗精神病藥物的抗抑鬱藥物治療抑鬱症患者更有可能在那些高基線CGI-S。53

縱向處方數據進行了分析,表明抗抑鬱藥處方減少對美國食品和藥物管理局(FDA)在兒童和青少年的自殺風險的警告。54繼續與丁丙諾啡治療的持續時間(一種阿片受體部分激動劑用於治療阿片樣物質使用障礙的人)更短的人更大的阿片樣物質使用障礙嚴重程度和共病的人吸食大麻障礙。55

beplay体育相关新闻心理健康信息學

以及分析RWE生成,數據集被用來開發新穎的數據可視化和預測分析方法來支持分析心理健康RWD包括一個數據可視化工具來支持臨床決策,beplay体育相关新闻56一個模型來預測治療反應在重度抑鬱症,57從臨床試驗基礎設施增加數據clinician-administered EHR的等級量表,58和數據可視化工具來評估比較精神藥物的有效性。59

此外,非結構化自由文本數據的可用性支持NLP的開發工具自動從數據集中提取臨床有意義的信息,如前所述。33 60

優勢和局限性

NeuroBlu數據集包含的豐富來源鑒定EHR數據支持代RWE改善精神障礙和影響因素的理解臨床結果。NeuroBlu包括數據在560多000人參加25日我們精神衛生保健提供者的21年。beplay体育相关新闻大樣本的大小和長時間的隨訪啟用well-powered代表實際臨床實踐狀況的統計分析。這個密鑰強度允許的調查研究問題不可行的解決與隨機對照試驗或前瞻性觀察性研究(例如,比較效益研究多種藥物或物質使用障礙的影響評估臨床結果)。

NeuroBlu是建立在一個健壯的deidentification管道,確保沒有個人可識別的數據可用於用戶分析數據。一個強大的數據安全框架,采用國際驗證加密標準保護匿名數據集從外部訪問NeuroBlu的可信的研究環境。這些保障措施確保數據的安全設置,同時仍然允許用戶方便地分析數據通過一個安全的網絡接口。NeuroBlu的圖形用戶界麵包含內置的功能來定義人口群體進行分析(隊列Builder),重新編碼數據變量(類別映射器)和想象臨床數據(數據資源管理器)的分布。此外,嵌入式統計軟件R和Python代碼(包括發動機)讓用戶直接查詢,收集和分析數據,同時保證數據保持在安全可靠的研究環境。這些特性允許用戶從一個廣泛的背景來分析統計軟件中的數據不需要專業知識,同時使專家數據科學家能夠在數據集上執行先進的分析方法使用R或Python。

NeuroBlu基礎設施開發使用觀察醫療結果夥伴關係共同數據模型(OMOP CDM),一個標準化的方法來協調醫療數據集。這種方法將用於引進新匿名精神衛生保健數據集到NeuroBlu可信研究環境使用聯邦數據查詢引擎平台進一步提高數據beplay体育相关新闻的可用性。

數據集從結構化社會人口數據以及臨床醫師症狀量表(CGI-S、CGI-S GAF和MADRS)。CGI-S數據超過80%的病人的數據集允許執行統計分析驗證臨床嚴重程度的標誌。另一個優點是使用NLP獲得臨床數據從非結構化自由文本臨床特征的MSE以及社會因素的數據。結合可用的結構化數據,這些提供一個詳細的臨床表型的個體接受精神衛生保健,可能支持協會的分析治療有不同的臨床表現。beplay体育相关新闻這種方法通常是不可行的在分析電子健康檔案數據集隻包含結構化數據或索賠數據。然而,NLP模型的一個限製是,他們可以產生假陽性和假陰性的情況下可以將錯誤引入到二次分析從電子醫療紀錄NLP-derived數據。NLP-derived數據還取決於臨床信息記錄的存在自由文本記錄。沒有文檔並不一定表明沒有一個特定的臨床係統構建和臨床醫生不文檔缺乏臨床特征的,除非它是臨床相關。

電子健康檔案數據記錄作為常規臨床實踐的一部分,數據集的一個限製是,臨床數據可能不是為所有病人全麵完成跨所有域。臨床醫生通常記錄數據相關的個體的臨床表現或治療方案,但未必不相關文檔的缺乏臨床特征和可能並不總是完全結構化臨床等級量表。值得注意的是,MADRS規模的完成比例還不到1%。然而,這種限製已經被計算解決派生分數基於可用的MADRS CGI-S數據。此外,豐富的臨床數據的可用性在非結構化文本(提取使用NLP)結合臨床嚴重程度的數據CGI-S意味著它有可能開發出派生的措施在結構化的症狀症狀嚴重程度等級量表是不可用。

目前,數據集隻包含clinician-recorded EHR數據,不包括任何patient-reported結果措施(舞會)patient-recorded症狀或藥物的副作用等。舞會中收集之間的時期臨床接觸可以幫助解決的局限性EHR前麵描述的數據提供心理健康症狀患者自我評分數據的負擔和對治療的反應,可以支持更微妙的證據生成和臨床決策。beplay体育相关新闻

數據集包括處方藥的數據,開始日期,結束日期和劑量信息。然而,它是不可能確定堅持治療,這不是通常直接觀察在常規臨床實踐。此外,一個人在哪裏收到多個醫療保健提供者,處方藥物與其他數據提供者可能不可用。

隨著數據集反映了一個動態的人口,患者可能會收到其他醫療保健提供者或進入或流域人口的診所使用MindLinc EHR係統。這意味著數據MindLinc以外的有關醫療衛生保健提供者(如急性生理衛生保健提供者或診斷和藥物記錄在社區初級保健設置)不是NeuroBlu中可用的數據集。

未來的計劃

當病人繼續使用MindLinc EHR收到醫療保健提供者,NeuroBlu數據集樣本容量會隨著時間的增加,後續的持續時間。我們計劃來分析這些數據來生成RWE更好地理解有關不良心理健康狀況的因素,評估治療的影響,開發更先進的NLP模型與改進的分類精度與專家在這個領域合作和發展預測分析工具,量化這些因素在個別病人的beplay体育相关新闻水平。61年我們的目標是把這些工具融入源EHR與patient-reported結果數據,為臨床醫生提供臨床決策支持實時可行的見解。這種方法可以幫助改善臨床結果更好的個性化精神衛生保健,減少延遲的有效治療。beplay体育相关新闻

協作

NeuroBlu的健壯的數據安全框架平台和嵌入式數據查詢和統計工具的可用性在一個基於web的圖形用戶界麵使MindLinc數據集分析來自不同專業學科的廣泛的用戶在任何地理位置。我們積極與學術合作夥伴支持精神衛生和心理衛生保健提供者RWE的一代。beplay体育相关新闻62年為此,我們強烈建議與個人合作,學術機構,衛生保健提供者和商業組織希望分析的數據集來支持精神衛生研究和通知醫療政策和臨床實踐。beplay体育相关新闻我們也歡迎與醫療服務提供者合作誰會有興趣使用NeuroBlu deidentification管道和可信的研究環境支持RWE生成的數據集。NeuroBlu平台上進一步的信息可以在我們的網站(https://www.neuroblu.ai在info@neuroblu),請與我們聯係。人工智能,討論合作和訪問平台的機會。

數據可用性聲明

數據可能會從第三方獲得,不公開。通過NeuroBlu鑒定數據可以分析平台(https://www.neuroblu.ai/)。我們強烈鼓勵協作和個人、學術機構、醫療服務提供者和商業組織希望分析的數據集來支持精神衛生研究和通知醫療政策和臨床實踐。beplay体育相关新闻請電子郵件info@neuroblu。訪問NeuroBlu ai進行進一步的信息。

倫理語句

病人同意出版

倫理批準

本研究涉及人類參與者但NeuroBlu平台已收到放棄授權進行分析鑒定醫療數據的WCG機構審查委員會(Ref: WCG-IRB 1-1470336-1)。

引用

補充材料

  • 補充數據

    僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。

腳注

  • 推特@RPatelDr

  • 貢獻者手稿是RP和SK。數據組裝和統計分析是由SNW和RR。報告的結果是由RP SK的支持。所有作者(RP、SNW RR、聖、JT RG,數控,MV,雜誌,MER, JS和SK)導致隊列概要設計、手稿準備和批準了最終版本。SK是擔保人。

  • 資金NeuroBlu數據集和MindLinc EHR係統由Holmusk擁有並全額資助。

  • 相互競爭的利益RP已經收到了美國國立衛生研究院資助的研究(NIHR301690),英國醫學研究理事會(先生/ S003118/1)的醫學科學院(SGL015/1020)和詹森。雜誌已收到谘詢費羅盤Inc .,路邊石顧問LLC艾瑪Corp . Evecxia療法,Inc . Holmusk, Liva-Nova,神經內分泌的生物科學公司Otsuka-US,從Liva-Nova演講費,約翰遜和約翰遜(詹森)和版稅從吉爾福德出版社。其他作者聲明沒有利益衝突。

  • 病人和公眾參與病人和/或公眾沒有參與設計,或行為,或報告,或傳播本研究計劃。

  • 出處和同行評議不是委托;外部同行評議。

  • 補充材料此內容已由作者(年代)。尚未審查由BMJ出版集團有限公司(BMJ)和可能沒有被同行評議。任何意見或建議討論僅代表作者(年代)和不了BMJ的支持。和責任起源於BMJ概不負責任何依賴的內容。內容包括任何翻譯材料,BMJ並不保證翻譯的準確性和可靠性(包括但不限於當地法規、臨床指南,術語,藥物名稱和藥物劑量),和不負責任何錯誤或遺漏引起的翻譯和改編或否則。