Propensity score
류 승 호

성균관의대 강북삼성병원
Propensity score는 Rosenbaum 과 Rubin에 의해 처음 제안되었고, 코호트 연구에서 혼란변수를 교정하기 위해 사용된다. 이러한 방법은 무작위 배정이 이루어지지 않은 그리고, 약물의 효과를 평가하려는 코호트 연구들에서 많이 사용되고 있다. 특히 “confounding by indication” 을 교정하려는 방법이다. 처방을 받은 환자군은 처방을 받지 않은 환자군에 비해 위험인자를 더 많이 가질 가능성이 높고, 처방을 받지 않은 환자군과 본질적으로 다를 수 있다. 따라서 폭로군과 비폭로군간 여러 혼란변수에 대해 가능한 비슷하게 맞추어서, 무작위배정 방법을 모방하려는 의도이다.
여기서 혼란변수를 정의해 보며, 혼란변수란 결과변수(질병)의 위험요인이며, 설명변수(폭로 또는 치료유무)와 관련이 있어야 하며, 설명변수과 결과변수간의 매개변수가 아니어야 한다.
Propensity score를 이용한 분석은 두 단계의 과정을 분석이 이루어진다.
첫째, 설명변수(폭로 또는 치료)을 종속변수를 생각하고, 설명변수를 예측하기 위해 여러 혼란변수를 같이 고려한 다변량 모델을 만든 후, 폭로 예측 확률(Propensity score)를 구한다.

Propensity score = Estimated probability (E+/covariate)

E: treatment group or group with exposure

둘째, Propensity score을 기초로 치료군과 비치료군을 matching을 한다. 또는 Propensity score를 한 개의 유일한 혼란변수로 생각하고, 층화분석 또는 다변량분석을 시행한다.

Propensity scores은 보정해야할 위험인자들이 많을 때 유용하다. 반면에 혼란변수들를 직접보정하는 전통적인 다변량분석방법에 비해 단점들이 가지고 있다. 즉 단일 공변수(covariate)과 결과변수와의 관계를 볼 수 없다. 특히 설명변수와 결과변수간의 interaction이 있을 수 있는 변수를 확인할 수 없다. 또한 혼란변수들을 보정하는 전통적인 다변량분석과 비교하여 결과값이 크게 차이가 나지 않는다. 결론적으로 혼란변수를 보정하기 위해서는 다변량분석과 Propensity scores 두가지 방법을 병행해서 사용하는 것을 추천한다.