隨機實驗被廣泛認為是評估治療效果的金標準,這是因為通過隨機化,研究人員可以在治療組和對照組之間創造可比性,從而消除混雜變數的影響。然而,在許多社會科學及醫學研究中,隨機化可能不切實際或不道德,例如在吸煙研究中,因倫理原因無法將人隨機分配到吸煙和不吸煙的治療組。這種情況下,傾向分數匹配技術(PSM)便應運而生。
傾向分數匹配是一種統計匹配技術,旨在通過考慮預測接受治療的協變量來估計一項治療、政策或其他干預的效果。
PSM 由保羅·羅森鮑姆和唐納德·魯賓於 1983 年首次提出,定義為給定一組可觀察的協變量時,某一單位(例如:個人、班級、學校)被分配到某一治療的條件概率。在觀察數據的統計分析中,PSM 旨在減少因混雜變數引起的偏倚,這些混雜變數可能影響治療效果的估計。如果僅將接受治療的組群與未接受治療的組群的結果進行比較,則可能會出現偏倚,因為結果的差異有可能來自於某些預測治療的因素。
在隨機實驗中,隨機化使得治療效果能夠無偏估計,而對於觀察性研究,研究對象的治療分配通常不是隨機的。
通過傾向分數匹配,我們可以減少治療分配偏倚,模擬隨機化的效果。具體來說,PSM 的第一步是估計每個參與者的傾向分數,這個分數是基於可觀察的協變量來預測某個單位被分配到治療組的概率。接著,通過將每個參與者與一個或多個未參與者基於這一分數進行匹配,創建一個在可觀察協變量上具有可比性的樣本。
在進行傾向分數匹配的過程中,研究人員首先會選擇一些與治療和結果都有關聯的混淆變量,然後利用邏輯迴歸等方法估計每個樣本的傾向分數。匹配技術可以包括最近鄰匹配、全最佳匹配、以及半徑匹配等方法,以確保治療和控制組在各協變量上的平衡性。
傾向分數匹配的一個關鍵優勢是能夠在不丟失大量觀察樣本的情況下,以單個分數平衡治療組和對照組,使得研究結果更具可靠性。
然而,雖然傾向分數匹配可以有效控制觀察到的協變量,這種方法仍然有其局限性。首先,它只能控制可觀察的協變量,而對於潛在的、不可觀察的特徵則無法加以考慮,這可能導致隱藏偏倚的存在。此外,PSM 通常需要大樣本數,以及治療組和對照組之間有足夠的重疊。學者朱迪亞·珀爾曾經提出,僅僅根據觀察變數進行匹配,可能會因為潛在人為因素的關聯而惡化偏倚。
儘管存在缺陷,傾向分數匹配方法在許多社會科學和公共衛生研究中成為了一個受歡迎的選擇,因為它幫助研究者克服了無法進行隨機化的障礙。通過合理的協變數選擇和匹配技巧,研究者們依然可以得出比較可信的效果估計。
最後,當我們回顧這些討論後,不禁會思考:在當前研究中,我們是否能更好地利用這些方法來處理觀察數據的偏倚問題?