통계·ML

Doubly robust estimation — IPW와 outcome 모델의 결합으로 인과 추정 안정화

Aramir 2026. 5. 16. 18:16

PSM·IPW는 propensity 모델이 틀리면 무너지고, 회귀는 outcome 모델이 틀리면 무너집니다. doubly robust는 두 모델을 결합해 둘 중 하나만 맞으면 정직한 효과 추정. 마케팅 인과 분석의 안전판.

무작위 배정이 안 되는 자리에 인과 효과를 추정하려면 두 가지 길이 있습니다 — propensity 모델 기반(PSM·IPW) 또는 outcome 모델 기반(회귀). 두 길은 각각 서로 다른 자리에서 깨집니다. doubly robust(이중 안전) 추정은 두 모델을 결합해, 둘 중 하나만 맞으면 정직한 효과 추정을 보장합니다. 마케팅 인과 분석의 안전판.

마케터가 이 글을 읽어야 하는 이유: 인과 분석 결과를 회의에서 신뢰성 있게 보고하려면 "이 추정의 모델 가정 중 어느 게 깨져도 결과가 무너지는가"를 먼저 답해야 합니다. doubly robust는 그 답이 "둘 다 깨져야 무너진다"라 회의 신뢰도가 한 단계 올라갑니다.

Propensity weighting과 outcome regression이 평행으로 결합되는 doubly robust 다이어그램
둘 중 하나만 맞으면 정직 — 인과 추정의 안전 마진.

1. PSM·IPW가 흔들리는 자리

PSM이나 IPW(역확률 가중)는 propensity score 를 정확히 추정한다는 가정에 의존합니다.

propensity 모델이 틀리면 매칭·가중이 잘못되고 효과 추정이 편향됩니다.

흔한 자리:

  • 비선형 관계 (로지스틱이 아닌 GBM 필요)
  • 변수가 너무 많음 (overfitting)
  • 관측 변수 부족 (unmeasured confounder)

2. Outcome 회귀가 흔들리는 자리

다른 길은 outcome을 직접 모델링하는 것. 를 회귀로 추정하고, 의 차이를 효과로.

outcome 모델이 틀리면 회귀 계수가 편향되고 효과 추정도 무너집니다.

흔한 자리:

  • 비선형 outcome (회귀 가정 위반)
  • interaction 효과 미포함
  • 결과 변수의 분포 가정 위반

3. Doubly robust의 한 줄 직관

두 모델을 결합해 어느 하나만 맞으면 정직한 추정을 보장.

둘 다 잘 추정하면 효율 최고, 하나만 맞아도 unbias, 둘 다 틀리면 무너짐.

수식으로(AIPW = Augmented IPW):

  • 첫 두 항: IPW 보정 (residual에 가중)
  • 세 번째 항: outcome 모델의 직접 추정

핵심: propensity 모델이 정확하면 첫 두 항이 정직. outcome 모델이 정확하면 세 번째 항이 정직. 둘 다 틀려야 무너짐.

4. AIPW vs 단순 IPW·회귀 비교

같은 데이터에 세 추정량을 적용하면 어떻게 다른지.

추정량 propensity 정확 outcome 정확 결과
IPW 정직
회귀 정직
IPW 편향
회귀 편향
AIPW 정직
AIPW 정직
AIPW 편향

AIPW가 IPW와 회귀의 위험 분산. 한 모델이 흔들려도 다른 모델이 받쳐주는 구조.

5. 코드 한 묶음 — Python AIPW 구현

이게 글에 박는 유일한 코드입니다.