在觀察性數據的統計分析中,傾向分數匹配(PSM)是一種統計匹配技巧,試圖通過考量預測接受處理的協變數來估算治療、政策或其他干預的影響。PSM旨在減少由於混淆變數所導致的估算偏誤,這些混淆變數可能會影響到處理效果的估計,這通常只比較接受治療的人與未接受治療的人之間的結果。
傾向分數旨在平衡接受治療與未接受治療的對照組,以減少因背景變數的差異而引入的偏誤。
這一概念是由Paul R. Rosenbaum和Donald Rubin在1983年提出的,他們將傾向分數定義為在一組觀察到的協變數下,單位(例如個人、課堂或學校)被分配到治療的條件概率。這種偏誤的可能性源於在接受治療的群體和未接受者之間的結果差異,這些差異可能是因為影響治療的因素,而不是治療本身所致。在隨機實驗中,隨機化能夠使治療效果的估算沒有偏誤;對於每個協變數,隨機化意味著治療組會在平均而言平衡。然而,在觀察性研究中,治療的指派通常不是隨機的。
傾向分數匹配的過程可以概括為以下幾個步驟:
傾向分數匹配的核心目的是在未來的分析中,實現相對無偏的治療效果估計。
傾向分數匹配雖然是一種強大的分析工具,但仍存在若干挑戰。首先,它無法考慮未觀察到的協變數,因此可能無法消除潛藏的偏誤。此外,PSM需要較大的樣本量,以確保治療組和控制組之間有足夠的重疊性。這意味著在使用PSM時,研究者必須仔細選擇參數,並確保數據的質量和適用性。
通過對已觀察的變數進行匹配,PSM能夠有效地比較兩個不平衡的群體,從而估算平均處理效果。
傾向分數匹配的應用範圍非常廣泛,尤其是在社會科學及醫學研究中。研究者經常用它來解決由於非隨機化造成的治療效果偏誤。舉個例子,當研究吸煙的效果時,由於道德原因無法隨機分配吸煙行為,因此PSM提供了一種可行的方法來控制同時影響吸煙和健康的多個因素。
傾向分數匹配作為一種減少觀察性數據中偏誤的方法,已經得到廣泛使用。雖然它有其局限性,但當合理且適當應用時,能夠極大地提高觀察性研究的信效度。你是否想過,除了傾向分數匹配,還有哪些其他有效的統計工具可以解決觀察性數據中的偏誤問題?