條文本

下載PDF

原始研究
評估結果patient-reported測量在前列腺癌患者根治手術:拉希分析
  1. 伊娃Protopapa1,
  2. Jan van der Meulen1,
  3. 卡羅琳·M·摩爾2,
  4. 莎拉·C·史密斯1
  1. 1衛生服務研究與政策,倫敦衛生與熱帶醫學學院的,倫敦、英國
  2. 2手術和介入科學分工,倫敦大學學院,倫敦、英國
  1. 對應到莎拉·C·史密斯博士;Sarah.Smith在{}lshtm.ac.uk

文摘

目標評估心理屬性(和識別特定的異常需要解決)症狀的尿和性功能尺度跟蹤和報告(STAR)儀器用於臨床實踐與個別男人使用拉希分析。

設計前瞻性群組研究。

設置英國9日在二級護理手術中心。

參與者403名男性被診斷出患有前列腺癌,並立即至少完成一個問卷之前和在根治性前列腺切除術後1 - 3個月。

主要和次要結果星儀器手術前和1和3個月之後。

結果無論是規模上拉希模型(鱗片p < 0.001)。尿(七項)和性功能(6項)無序閾值,表明響應類別不工作。兩個尺度(三個尿項;五性函數項符合項目)顯示問題(大殘差,重大χ2檢查的項目特征曲線)。隨著時間尺度顯示項都是不穩定的(微分項功能(DIF)時間)。尺度(四雙項在每個規模)顯示當地響應依賴(殘留相關性> 0.2高於平均水平)。組級別的內部一致性是可以接受的尺度。目標是可憐的兩個尺度,指示一個匹配項的位置和分布不足的病人,表明底層結構尺度意在衡量尚不清楚。

結論使用拉希分析作為診斷工具,我們發現,尿和性功能量表有問題需要解決之前明星可以用於對臨床實踐的信心。性功能的規模,特別是不太可能提供精確的估計結果根治性前列腺切除術後所經曆的男人。這些結果表明了需要評估的適用性patient-reported結果測量在日常臨床實踐中實現之前,最好是使用現代心理測量方法。

  • 泌尿外科
  • 前列腺疾病
  • 手術
http://creativecommons.org/licenses/by-nc/4.0/

這是一個開放的分布式條依照創作共用署名非商業性(4.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和許可他們的衍生產品在不同的協議,提供了最初的工作是正確地引用,給出合適的信用,任何更改表示,非商業使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

本研究的優點和局限性

  • 使用現代心理測量方法(基於拉希測量理論)來確定適當的使用總得分函數來描述病人的性或泌尿功能。

  • 決定如何項目在每個規模反映了男性的經驗報告調查問卷。

  • 確定特定異常表明量表的分數沒有使用和理解的目的。

  • 沒有改變的項目調查問卷根據我們的研究,所以沒有這些變化將使評估任何潛在的改進。

介紹

使用patient-reported結果措施(舞會)已迅速增加。1 - 3在英國,舞會通常收集幾個選擇性外科手術領域的評估結果組的患者,接受特殊治療或在一個特定的醫院接受治療。4個5類似的方法正在考慮其他條件。

然而,缺乏證據的臨床醫生可以使用舞會來讓他們的臨床實踐更多的響應個別病人的的需求。也有人建議,舞會可以為病人發揮重要作用,因為他們可以幫助告知患者可以自己管理條件的方法。6 7

一個基於web的工具稱為症狀跟蹤和報告(明星)8開發的紀念斯隆凱特林癌症中心(美國紐約)激進的前列腺癌治療的監測結果在個別病人。該儀器用於告知外科醫生和男性功能結果手術後,如尿性和腸功能改善或惡化。其發展隻是一個例子的實現舞會在前列腺癌實踐通知臨床醫生和病人。9 - 11

星儀器並不是設計來比較男人手術之前和之後的功能地位,因為不同的問題中包括預處理和後處理明星問卷。這意味著評估手術前手術後在不同的“統治者”相比之下,因此沒有明確的理解方式的改變意味著什麼。然而在實踐中,例如在英語國家舞會項目、預處理和後處理舞會通常比較監控選擇性外科手術的影響。2

工具,如星的目標來衡量特定的“構造”。這些儀器有足夠的心理屬性是很重要的,否則他們可能產生的分數是不準確的(容易係統誤差)或“不準確”(容易隨機誤差),使得它難以理解觀察到的分數是什麼意思,更難以解釋會隨著時間而改變。

必須滿足的標準以確保舞會是健壯的。12 - 15他們確保“規模”,結果加起來回答個人問題(項目)與一個明確的基本構造,不同於描述性的反應或簡單項症狀發生多少次。

像大多數健康舞會,這顆星儀器開發使用傳統心理方法基於經典測試理論(CTT)。這些方法有重要的局限性。16首先,天平使用總部開發生產“序數的分數”,兩個相鄰得分之間的差異在不同的點的規模可能不相等。這帶來一個問題,因為大多數統計分析認為分數區間屬性,鄰近得分之間的差異是平等的整個範圍。當尺度是基於序數分數,隨時間變化尤其難以解釋。第二,成績隻能解釋為組的患者,因為這些分數的統計不確定性的措施(例如,SEs)隻計算在集團層麵,這限製了他們對個別患者使用。17第三,鱗片的性能依賴於特定示例中使用它們。這很難比較研究,更重要的是,進一步削弱了隨時間變化的解釋。

現代心理測量的方法,如基於項目反應理論的(紅外熱成像)或拉希測量理論,提供了一種方法克服這些挑戰。都是將順序尺度轉換為區間數學建模方法措施,提供了某些model-related標準得到滿足。但是紅外熱成像采用統計的方法將參數添加到模型以改善其健康數據,拉希範式需要theory-driven方法,調查數據不符合拉希模型的原因。18 - 20拉希範式使儀器的中心概念基礎和提供了一套明確的診斷數據,可以幫助識別異常的分數。

儀器開發使用這些現代心理測量方法主要有四個優勢CTT-based儀器。首先,他們有可能產生真正的分數間隔,從而提高準確度和精密度的隨時間變化可以被評估。第二,統計不確定性的措施可以是分數的個人受訪者估計,這意味著在病人級分數的解釋更有意義。第三,它可以產生規模不依賴於特定樣本的特征。第四,他們可以創建一個模型,其中包含presurgery和參與項目,因此所有的物品都可以校準在相同的統治者。常用的預處理和後處理分數仍然可以派生但校準以這樣一種方式,他們可以適當的比較。

在係統回顧7前列腺癌特異的舞會,包括儀器,21我們發現,現代心理測量方法沒有被用於評估這些工具的心理特性。拉希在這項研究中,因此我們使用分析來估計尿和基於反應為個人男性性功能的明星儀器提供的男人立即之前和激進的前列腺癌手術後3個月。這樣做,我們旨在識別異常應該解決星儀器,或任何其他舞會,旨在監測前列腺癌手術後結果隨時間的變化,適用於日常臨床實踐。

我們基於拉希測量理論進行分析,以確定是否適合使用總得分函數來描述病人的性或泌尿功能。經常比較術前和對象之間的分數,我們旨在確定7術前和五個對象,項目可以放置在同一測量統治者。如果他們可以,那麼可以跨越時間進行有意義的比較。要做到這一點,我們“堆疊”數據,換句話說,我們添加了每個患者的基線和隨訪分數作為單獨的記錄。22

分析旨在回答一些問題。首先,測量尺已經成功了嗎?第二,人們已經成功地測量了嗎?第三,scale-to-sample目標足夠嗎?每一個問題的方法簡要解釋如下。拉希測量理論的一個更廣泛的解釋中可以找到最近的概述。23

方法

設置和參與者

參與者招募了2015年11月至2017年3月從九個中心執行根治性前列腺切除術的方法(開放、laparoscopic-assisted或機器人)在英國。人的資格,如果他們被診斷出患有前列腺癌,將根治性前列腺切除術,並有足夠的英語語言理解研究和完成所需的信息在線問卷。

各中心臨床團隊識別並找到符合條件的病人,告知他們關於這項研究,並注冊感興趣的人參與安全的在線門戶。注冊病人收到他們的登錄信息通過短信或者郵件,登錄到門戶完成同意書。一旦患者同意了,他們直接在線問卷。病人手術前被邀請來完成問卷調查,和1、3、6和12個月後手術。

儀器

星儀器包含四個領域:性功能,泌尿功能,腸功能和整體生活質量。我們的分析集中在尿和性功能量表立即獲得1和手術後3個月。我們從心理分析與排除腸規模隻有兩項內容要考慮規模不足。同樣,沒有考慮單項評價量表整體生活質量在我們的分析。

尿和性功能物品是11點李克特量表得分在三分。恒星的術前的形式儀器包括七個項目和排尿功能對象形式包括5個(問題2和4是很常見的)。對於性功能,相同的6個條目都包括在presurgery和參與形式。條目分數求和的尿和性功能域,然後轉化為分數從0到100不等。

我們做了兩個措辭改變星儀器。首先,我們的數據收集還包括擴大前列腺癌指數複合(EPIC) -26問卷(沒有報告摘要),與一些明星產品。在一個項目中存在這兩個調查問卷,我們使用了史詩般的措辭。這些微小的措辭的變化不太可能大幅改變產品的性能。其次,明星的標準更新版本的時間6個月術前性和泌尿功能,術後4周性功能和術後1周尿功能。以確保一致性尿和性功能的時間域,我們使用一個四周回憶期。我們認為這足夠注意到和/或解決所有問題。所有項目管理在所有時間點。

數據分析

整體模型適合

對於每個規模,我們評估是否觀察到的反應明顯不同的反應預計基於拉希模型(χ2統計)。

項閾值排序

每個條目上的更高層次的功能,“支持”的概率更高的響應類別(李克特量表)應該增加和支持較低的響應類別的概率減少。如果每個響應類別反過來(0,1,2,3,4,5)的概率最高水平增加的支持功能,類別之間的“閾值”(0 - 1、1 - 2、2 - 3、3 - 4、4 - 5)顯示邏輯順序。規模閾值的位置在兩個相鄰的響應類別等概率(50%)的支持。

然而,經驗閾值可以無序(例如,0 - 1,2 - 3、1 - 2),表明響應類別不按預期工作。這可以因為一個項目有模棱兩可的措辭或標簽響應規模不夠明顯。我們評估響應類別是否按預期工作的目視檢查類別概率曲線。

項目符合有效性

規模的項目必須一起工作(合適的)一組一致的臨床和統計學。臨床上,沿著連續項排序應該有意義和統計,需要滿足指定條件的條目。否則,它是不合適的求和項反應達到總分的總分作為衡量和考慮結構。當物品不合作(“不合群”)通過這種方式,規模需要質疑的有效性。

我們評估每個項目的拉希模型通過檢查其“適合剩餘”(可接受範圍的±2.5),考慮到相關的χ2價值。我們也評估視覺如何密切觀察到的“階級間隔意味著分數”按照“項目特征曲線”的預期值。類間隔分組大約相同數量的受訪者有相同級別的功能。

微分項功能

項目位置的穩定性是通過評估評估微分項功能(DIF)。DIF發生在不同的組內樣本,例如不同年齡的患者,一個項目的反應是不一樣的,盡管相同級別的功能。DIF標識通過方差分析(方差分析)主要影響“人的因素”,例如年齡之間的互動因素和階級的人的間隔。

尿和性功能的尺度,我們評估DIF的年齡,種族,地位和並發症的數量關係。項的得分前後手術(兩項泌尿功能規模和所有六項性運作規模),我們也評估時間點DIF。

當地的響應依賴

一個條目的響應不應該直接影響反應到另一個。如果“項response-dependency”發生,測量估計可能有失偏頗,和可靠性,表示“人分離指數”,人為地增加了。當地響應依賴評估通過檢查後的剩餘物品之間的相關性拉希因素在共同的部分了。相關係數的值大於0.20以上所有項目的平均剩餘相關性表明潛在的本地響應依賴。24

可靠性(內部一致性)

可靠性是研究使用“人分離指數”這是一個統計與克倫巴赫的α,常用於傳統方法基於研究結論。量化是可靠的區分受訪者。它是計算從之間的變異人的位置相對於被估計為每個單獨的SE。16更高的人分離索引值顯示更好的可靠性;在集團層麵值> 0.70 > 0.85,個人層麵表明足夠的可靠性。20.

樣本規模目標

“Scale-to-sample瞄準”描述了構造之間的匹配範圍的測量項目和範圍的構造在樣例的患者。這是由person-item分布的評估,比較之間的差異“人位置”和“項閾值的位置”在底層統治者,捕獲例如尿或性功能。任何空白項閾值的位置,特別是在低和高的結束,意味著受訪者位於這一差距的功能區域無法測量精確。換句話說,他們的分數會有一個相對較大的測量,因為他們的估計是由信息缺失嚴重影響。

所有p值調整為樣本量χ(n = 500)2樣本容量值敏感。25作為敏感性分析的校正p值,我們重複分析的隨機抽樣400人。此外,Bonferroni調整為多個測試也被應用。所有的分析都使用RUMM 2030。26

病人和公眾參與

病人和公眾沒有參與設計,項目的行為或傳播,除了參與這項研究。

結果

研究樣本

總的來說,971人都有資格,其中有873人,714人感興趣並且有431人完成了網上同意書,給一個總體招聘率為44.4%。

同意提供的431名患者,403例患者(93.5%)至少完成一個有效的調查問卷。共有366份有效問卷在基線,完成222份問卷被完成在手術後1個月,在手術後3個月181份問卷。表1描述了403名患者的特點包括在分析中。這些患者的平均年齡為63歲(SD 6.7;範圍41 - 78年),英國(79.7%),主要是白色或白色,大多是已婚或同居的情侶(76.7%)。

表1

403名患者的樣本特征至少完成一個有效的調查問卷

整體模型適合

整個χ2統計表明,排尿功能和性功能量表適合拉希模型(泌尿功能,χ2= 207.04,p < 0.001;性功能,χ2= 341.98;p < 0.001)。

項閾值排序

尿和性功能量表有物品無序閾值,表明回答選項沒有按預期工作。泌尿功能規模無序閾值為7的10項。這七個無序物品,類別概率情節圖1 g說明,這是一個主要的問題與回答選項,這表明措辭不清楚或類別的區別不是很清楚。例如,對於第三季度的泌尿功能規模(在過去的4周,多長時間你發現你又停了下來,開始幾次當你撒尿嗎?)沒有點閾值2(大約一半的時間)和閾值3(少於一半的時間)是最有可能發生。如果回答選項按預期工作,每個閾值的概率應該在秩序。

圖1

(g)泌尿功能類別概率曲線無序的物品。

所有六個無序性函數的項。這意味著沒有一個響應尺度作為他們的目的。圖2 f表明它主要是無序的閾值2和3,表明中間類別的響應範圍不是很清楚,可能需要改寫。

圖2

(f)性功能類別概率曲線無序的物品。

項目符合有效性

尿和性功能量表包含項不符合模型,在考慮他們的殘餘,χ2價值,項目特征曲線(適合殘差和太極拳2值為所有項目報告表2)。一個泌尿功能項(Q23處)失敗的所有三個標準對模型表明不合群。另外兩個項目失敗的一個或兩個標準(Q3和a7)指示項適合更廣泛的問題。

表2

尿性function-item功能和健康

五性功能項目失敗的所有三個標準(表2),其餘項目失敗的三個項目符合標準提出進一步的問題。

微分項功能

總體而言,項目在兩個尺度穩定(不變的)在不同群體在年齡、種族、地位和關係的數量。然而,鱗片包含項目,都是在時間不穩定,與性功能量表包含大量不穩定的項目。

一個尿項(Q23處)顯示DIF跨時間點(p < 0.001)。病人的反應這一項係統性地高於在術後3個月和1個月時間均相比,盡管擁有平等的基礎水平的泌尿功能。

五性功能項(九方,Q10、Q11 Q12,問題)顯示DIF時間(p < 0.001)

當地的響應依賴

量表包含雙項都是相互依賴,但性功能量表顯示當地依賴性更大。四對泌尿功能項顯示本地依賴:第三(再次停止和啟動)和第四季度(推遲排尿困難)(剩餘相關= 0.10);Q5(弱尿流)和Q6(推或應變開始排尿)(剩餘相關= 0.04);問題19(漏尿)和溫度係數(每日墊數量)(剩餘相關= 0.32);溫度係數(每日墊數量)和Q23處(泌尿問題總體)(剩餘相關= 0.13)。

四對性功能物品顯示本地依賴性較高的殘餘相關性:Q10(安裝在性活動)和Q11(滲透)勃起困難(剩餘相關= 0.30),12(能夠穿透)和問題(保持勃起後滲透)(剩餘相關= 0.59),12(能夠穿透)和Q14(維護安裝完成)(剩餘相關= 0.55),問題(保持勃起後滲透)和Q14(維護安裝完成)(剩餘相關= 0.51)。

可靠性

在集團層麵內部一致性是可以接受的尺度(泌尿功能規模:人分離指數= 0.75;性功能量表:人分離指數= 0.82)。

Scale-to-sample目標

泌尿功能規模的person-item分布是相對貧窮,雖然比性功能量表(的目標圖3一)。雖然中間的人分布合理匹配的項目,兩個極端,分布有幾項。這意味著男性位於低端的規模(包括許多男人在手術後1個月)和高端的規模(包括手術前很多男人)的水平不能精確測量的功能。

圖3

(一)尿函數person-Item分布(目標)。(B)性功能person-Item分布(目標)。

性的目標功能規模也差(圖3 b)。特別是,大多數項目都位於中心的規模而人的分布很寬。這意味著男性的性功能位於天平的高端手術前(通常是男人)和天平的低端(大多數的男性手術後)很不嚴密地測量。

敏感性分析進行隨機抽樣(n = 400)廣泛的顯示模式的結果比得上整個本文提供的示例結果。針對圖、無序閾值模式的地方響應依賴和DIF非常相似。項目的模式適合略有改進的隨機抽樣和預期少(因為n是小)項目符合標準不適合基於殘差和x平方分布的重要性。然而,變化的模式在項目不合群和原樣品一樣的方向。

討論

我們的分析發現,無論是泌尿功能項還是性功能星儀器可以放在商品的一種常見的指標,對手術前後比較健壯。此外,大量的異常已確定表明尺度不按預期工作。有一個匹配項的位置和分布不足的病人,表明底層結構尺度意在衡量尚不清楚。因此,項目不準確測得男人的函數。響應類別對許多項目不一致,有些項目不與別人合作整合設置和一些物品是不穩定的。

這些結果表明,在其目前的形式來看明星儀器中的商品不提供足夠的統治者監測尿或性功能在臨床實踐中。這些問題可能會使一個人的評估病人的手術後結果不準確和精確,使用調查問卷以它目前的形式來看,因此,帶有歪曲實際尿和性的結果的風險。

我們的研究結果表明,不準確的風險評估結果的使用明星可能是男性最為明顯很好或很差的結果。窮人scale-to-sample目標,特別是性運作規模,也意味著這個問題加劇了對男人有更好的功能手術前和手術後的嚴重功能,建立明確的變化的解釋分數的問題,應該捕獲手術的影響。此外,尺度都顯示DIF項目時間提供進一步的證據,不是有意義的成績比較手術或前後成績比較,手術後在不同的時間。

在短期內,一些確定的缺陷可以通過事後的統計技術來解決改無序的閾值16日20或解決統一的DIF25和當地響應的依賴。20.然而,一個更健壯的解決方案是進行定性研究與理解為什麼男人經曆了根治性前列腺切除術的問題不是很好理解,為什麼回答選項不習慣的目的。定性研究也應該探索領域的內容丟失,如何製定項目解決這些漏洞。基於這些發現將修訂版本需要再次心理測量學的評估來確定修改內容和評分如何處理識別問題。

這項研究是第一個使用健壯的現代心理測量方法如拉希分析來確定的測量屬性前列腺癌特異的舞會21收集舞會,評估其是否適合用於臨床實踐層麵的個別病人。它讓我們仔細審查每一個方麵的問卷調查,識別哪些方麵好,不工作。

在我們的研究中,問卷完成後在家裏而不是在診所和我們設置和設置可能存在差異,最初是用於開發儀器,尤其是支持男人收到的數量,同時完成問卷。

我們還使用一個不同的時間框架,不適應英國英語的問題(我們想評價的原始問卷我們措辭)。然而,很可能異常識別與項目不合群和不一致的閾值排序反映了模棱兩可的措辭和混淆而不是簡單的語言之間的差異美國和英國英語。

我們所有的分析使用了一個Bonferroni調整調整p值。盡管廣泛使用,這種方法已被批評為保守。這個會有這樣的影響而異常中發現這兩個尺度的數量。

結論

使用拉希分析作為診斷工具,我們已經確定了幾個缺點恒星的樂器。在其目前的形式來看,排尿功能和性功能量表有問題需要解決之前明星可以用於對臨床實踐的信心。性功能的規模,特別是不太可能提供精確的估計結果根治性前列腺切除術後所經曆的男人。兩個尺度,底層構造不清楚,需要進一步的調查。

我們的結果證明了需要評估的適用性舞會在日常臨床實踐中,包括例如EPIC-26目前前列腺癌治療中實現在英國,10 11使用現代心理測量的方法來識別和解決不足,影響他們的心理表現。

沒有適當的心理調查和相關的進一步發展需要,在日常臨床實踐中使用舞會可能明顯歪曲真實的病人的臨床結果。舞會產生不準確和不精確的分數值有限臨床醫師旨在應對病人的需要。不準確和不精確的分數也會破壞舞會可以對患者的指導作用要貢獻的管理自己的條件。沒有在這一領域不斷取得進展,我們失去了機會,展示新技術帶來的好處。這將不利於病人的現在和未來。

確認

這項工作是TrueNTH英國郵報手術項目的一部分。TrueNTH八字胡十一月基金會的全球倡議,旨在識別和展示的最佳和最有效的模型改善前列腺癌生存關懷和支持。作者還要感謝博士Jolijn•有用的評論草案的手稿。

引用

腳注

  • 推特@mrsprostate

  • 貢獻者EP寫論文的初稿,SS和EP負責心理分析。CMM和JvdM負責的設計研究。所有作者的貢獻起草手稿,批準了最終版本。

  • 資金這項工作是由英國前列腺癌。

  • 免責聲明資助者沒有有下列作用:設計和行為的研究中,數據收集和管理,數據分析和解釋,或準備、審批和審查的手稿。

  • 相互競爭的利益沒有宣布。

  • 病人和公眾參與病人和/或公眾沒有參與設計,或行為,或報告,或傳播本研究計劃。

  • 病人同意出版不是必需的。

  • 倫理批準倫理批準獲得的研究(研究標題:英國真正的n - Post手術隨訪;REC參考15 / SC / 0451)。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據可用性聲明沒有數據是可用的。