AX 스쿼드 꿈나무반 · 원데이 워크샵

인과분석 3종 세트
워크샵 자료 모음

EBM · DiCE · DoWhy — Wine & Housing → 편의점 매출 연결

🍷 Wine 데이터 🏠 Housing 데이터 🏪 편의점 연결

워크샵 개요

상관관계가 아닌 인과관계로 비즈니스 의사결정을 내리는 방법을 배웁니다.

오늘의 미션

"AI로 속도는 확보됐다. 이제 필요한 건 가설 설계력 + 결과 해석력 + 비즈니스 연결력"

편의점 한 점포의 매출을 결정하는 원인을 찾고, "무엇을 바꾸면 매출이 오르는가?"를 데이터로 답할 수 있어야 합니다. 하지만 편의점 데이터를 처음부터 다루는 것은 어렵습니다.

그래서 오늘은 정답이 잘 알려진 두 개의 데이터(와인 품질, 주택 가격)로 방법론을 완전히 손에 익힌 후, 편의점 매출 문제에 그대로 적용합니다.

ℹ️ 레시피 학습 원칙: 새 요리를 익힐 때는 재료가 명확하고 결과를 바로 검증할 수 있는 요리부터 만듭니다. Wine(품질 등급)과 Housing(집값)은 그런 연습 데이터입니다.

오늘 끝에 얻을 것

목표내용
① EBM 읽기shape function으로 "어떤 피처가 타겟에 얼마나, 어떤 방향으로 영향을 주는가"를 직접 읽을 수 있다
② DiCE 시나리오"원하는 결과를 얻으려면 어떤 조건을 바꿔야 하는가"의 실행 가능한 시나리오를 만들 수 있다
③ DoWhy 인과 검증"상관관계인가, 진짜 인과관계인가"를 구분하고 primary / secondary index를 정의할 수 있다
④ 편의점 연결세 가지 방법론을 편의점 매출 데이터에 연결하는 매핑 구조를 직접 작성할 수 있다

3종 방법론 — 각자의 역할

01 · EBM

Explainable Boosting Machine

"어떤 피처가 예측에 얼마나 영향을 줬는가?" — shape function으로 비선형 관계까지 시각화

02 · DiCE

Diverse Counterfactuals

"원하는 결과를 얻으려면 무엇을 바꿔야 하는가?" — actionable 피처만 조정한 현실적 시나리오 제안

03 · DoWhy

Causal Inference

"그 피처가 진짜 원인인가?" — DAG로 교란 변수를 통제하고 ATE(평균 처치 효과)를 추정

EBM
"무엇이 중요한가"
상관 기반
DoWhy
"그게 진짜 원인인가"
인과 검증
DiCE
"어떻게 바꿀까"
반사실 시나리오
방법론핵심 질문도구오늘 데이터
EBM무엇이 예측에 영향을 줬는가?interpretMLWine + Housing
DiCE원하는 결과가 되려면 무엇이 바뀌어야 하는가?dice-mlWine
DoWhy그걸 바꾸면 정말 결과가 바뀐다고 말할 수 있는가?dowhy, EconMLHousing

오늘의 일정

시간세션소요
09:00Session 00 · 킥오프 & 방법론 소개30분
09:30Part 1 · Wine EDA & 피처 이해45분
10:15Part 1 · EBM 실습 — shape function · Top 5 피처 도출60분
11:15Part 1 · DiCE 실습 — medium → high 전환 시나리오45분
12:00점심60분
13:00Part 2 · S3 파이프라인 연동45분
13:45Part 2 · Housing EDA & EBM 실습45분
14:30Part 2 · DoWhy 인과추론 — DAG 설계 · identify → estimate → refute90분
16:00쉬는 시간15분
16:15Part 3 · 브리지 세션 — Wine/Housing → 편의점 매핑45분
17:00Part 3 · 팀별 발표 & 인사이트 공유45분
17:45Part 3 · KPT 회고 & 마무리15분

세션 자료

Session 00 · 09:00

킥오프 & 방법론 오리엔테이션

EBM · DiCE · DoWhy 3종 역할. 데이터셋 소개. S3 구조.

세션 자료 →

Session 01 · 09:30

Wine Quality — EBM + DiCE

UCI Wine EDA · shape function · DiCE counterfactual 생성.

세션 자료 →

Session 02 · 13:00

California Housing — S3 + EBM + DoWhy

S3 파이프라인 · 회귀 EBM · DoWhy DAG · ATE 추정.

세션 자료 →

Session 03 · 16:15

편의점 브리지 · 발표 · 회고

Wine/Housing → 편의점 매핑 · DAG 설계 · KPT 회고.

세션 자료 →

분석 리포트 & 부록

리포트

Wine Quality 분석 리포트

EBM 이진 분류 (정확도 88.1%) + DiCE 개선 시나리오 3종.

리포트 →

리포트

DoWhy 인과추론 리포트

MedInc ATE +$35,390 · HouseAge ATE +$550 추정 결과.

리포트 →

리포트

Housing EBM+DoWhy 리포트

EBM R² 0.84 + DoWhy 지리 교란 통제 인과 효과 분석.

리포트 →

부록

인과분석 3종 세트 — 용어 가이드

Shape Function · Counterfactual · Backdoor Path · Estimand · ATE 등 핵심 용어를 실무 의미로 풀어낸 참조 문서. 편의점 매출 적용 매핑표 수록.

용어 가이드 →


오늘의 핵심 문장

EBM은 "무엇이 예측에 영향을 줬는가?"를 보여준다.
DiCE는 "원하는 결과가 되려면 무엇이 바뀌어야 하는가?"를 보여준다.
DoWhy는 "그걸 바꾸면 정말 결과가 바뀐다고 말할 수 있는가?"를 따진다.
⚠️ Feature importance는 원인이 아니다. Counterfactual은 실행 계획이 아니다. Causal estimate도 가정이 틀리면 틀릴 수 있다.

세 방법론을 순서대로 쌓는 것이 오늘의 흐름입니다. EBM이 밝힌 중요 피처를 DoWhy로 인과 검증하고, 인과가 확인된 피처를 DiCE로 시나리오화합니다.