AX 스쿼드 꿈나무반 · 원데이 워크샵
인과분석 3종 세트
워크샵 자료 모음
EBM · DiCE · DoWhy — Wine & Housing → 편의점 매출 연결
워크샵 개요
상관관계가 아닌 인과관계로 비즈니스 의사결정을 내리는 방법을 배웁니다.
오늘의 미션
"AI로 속도는 확보됐다. 이제 필요한 건 가설 설계력 + 결과 해석력 + 비즈니스 연결력"
편의점 한 점포의 매출을 결정하는 원인을 찾고, "무엇을 바꾸면 매출이 오르는가?"를 데이터로 답할 수 있어야 합니다. 하지만 편의점 데이터를 처음부터 다루는 것은 어렵습니다.
그래서 오늘은 정답이 잘 알려진 두 개의 데이터(와인 품질, 주택 가격)로 방법론을 완전히 손에 익힌 후, 편의점 매출 문제에 그대로 적용합니다.
ℹ️ 레시피 학습 원칙: 새 요리를 익힐 때는 재료가 명확하고 결과를 바로 검증할 수 있는 요리부터 만듭니다. Wine(품질 등급)과 Housing(집값)은 그런 연습 데이터입니다.
오늘 끝에 얻을 것
| 목표 | 내용 |
|---|---|
| ① EBM 읽기 | shape function으로 "어떤 피처가 타겟에 얼마나, 어떤 방향으로 영향을 주는가"를 직접 읽을 수 있다 |
| ② DiCE 시나리오 | "원하는 결과를 얻으려면 어떤 조건을 바꿔야 하는가"의 실행 가능한 시나리오를 만들 수 있다 |
| ③ DoWhy 인과 검증 | "상관관계인가, 진짜 인과관계인가"를 구분하고 primary / secondary index를 정의할 수 있다 |
| ④ 편의점 연결 | 세 가지 방법론을 편의점 매출 데이터에 연결하는 매핑 구조를 직접 작성할 수 있다 |
3종 방법론 — 각자의 역할
01 · EBM
Explainable Boosting Machine
"어떤 피처가 예측에 얼마나 영향을 줬는가?" — shape function으로 비선형 관계까지 시각화
02 · DiCE
Diverse Counterfactuals
"원하는 결과를 얻으려면 무엇을 바꿔야 하는가?" — actionable 피처만 조정한 현실적 시나리오 제안
03 · DoWhy
Causal Inference
"그 피처가 진짜 원인인가?" — DAG로 교란 변수를 통제하고 ATE(평균 처치 효과)를 추정
EBM
"무엇이 중요한가"
상관 기반
→
DoWhy
"그게 진짜 원인인가"
인과 검증
→
DiCE
"어떻게 바꿀까"
반사실 시나리오
| 방법론 | 핵심 질문 | 도구 | 오늘 데이터 |
|---|---|---|---|
| EBM | 무엇이 예측에 영향을 줬는가? | interpretML | Wine + Housing |
| DiCE | 원하는 결과가 되려면 무엇이 바뀌어야 하는가? | dice-ml | Wine |
| DoWhy | 그걸 바꾸면 정말 결과가 바뀐다고 말할 수 있는가? | dowhy, EconML | Housing |
오늘의 일정
| 시간 | 세션 | 소요 |
|---|---|---|
| 09:00 | Session 00 · 킥오프 & 방법론 소개 | 30분 |
| 09:30 | Part 1 · Wine EDA & 피처 이해 | 45분 |
| 10:15 | Part 1 · EBM 실습 — shape function · Top 5 피처 도출 | 60분 |
| 11:15 | Part 1 · DiCE 실습 — medium → high 전환 시나리오 | 45분 |
| 12:00 | 점심 | 60분 |
| 13:00 | Part 2 · S3 파이프라인 연동 | 45분 |
| 13:45 | Part 2 · Housing EDA & EBM 실습 | 45분 |
| 14:30 | Part 2 · DoWhy 인과추론 — DAG 설계 · identify → estimate → refute | 90분 |
| 16:00 | 쉬는 시간 | 15분 |
| 16:15 | Part 3 · 브리지 세션 — Wine/Housing → 편의점 매핑 | 45분 |
| 17:00 | Part 3 · 팀별 발표 & 인사이트 공유 | 45분 |
| 17:45 | Part 3 · KPT 회고 & 마무리 | 15분 |
세션 자료
Session 01 · 09:30
Wine Quality — EBM + DiCE
UCI Wine EDA · shape function · DiCE counterfactual 생성.
Session 02 · 13:00
California Housing — S3 + EBM + DoWhy
S3 파이프라인 · 회귀 EBM · DoWhy DAG · ATE 추정.
분석 리포트 & 부록
부록
인과분석 3종 세트 — 용어 가이드
Shape Function · Counterfactual · Backdoor Path · Estimand · ATE 등 핵심 용어를 실무 의미로 풀어낸 참조 문서. 편의점 매출 적용 매핑표 수록.
오늘의 핵심 문장
✅ EBM은 "무엇이 예측에 영향을 줬는가?"를 보여준다.
✅ DiCE는 "원하는 결과가 되려면 무엇이 바뀌어야 하는가?"를 보여준다.
✅ DoWhy는 "그걸 바꾸면 정말 결과가 바뀐다고 말할 수 있는가?"를 따진다.
⚠️ Feature importance는 원인이 아니다. Counterfactual은 실행 계획이 아니다. Causal estimate도 가정이 틀리면 틀릴 수 있다.
세 방법론을 순서대로 쌓는 것이 오늘의 흐름입니다. EBM이 밝힌 중요 피처를 DoWhy로 인과 검증하고, 인과가 확인된 피처를 DiCE로 시나리오화합니다.