Session 03 · Part 3 · 16:15 – 18:00
편의점 매출 브리지
발표 & 회고
오늘 배운 것을 편의점 언어로 번역한다
편의점 브리지 · 발표 · 회고
오늘 하루의 학습 여정을 완성하고, 다음 스프린트 계획을 세웁니다.
오늘의 학습 여정 완성
방법론
소개
→
EBM
Wine 원인해석
→
DiCE
Wine What-if
→
S3
파이프라인
→
EBM
Housing 회귀
→
DoWhy
인과추론
→
🏪
편의점 적용
"오늘 여러분은 데이터가 바뀌어도 구조는 같다는 것을 직접 체험했습니다. Wine의 '알코올 → 품질'이 편의점의 '프로모션 → 매출'과 같은 형태입니다."
3-1 · 브리지 세션
오늘 배운 것 총정리 — 3종 방법론 매핑표
| 구분 | 🍷 Wine 데이터 | 🏠 Housing 데이터 | 🏪 편의점 매출 (다음 스프린트) |
|---|---|---|---|
| 문제 유형 | 분류 (low/mid/high 품질) | 회귀 (집값 중앙값) | 회귀 (일매출액, 단점포 단위) |
| 타겟 변수 | quality_label | MedHouseVal | daily_sales (일매출) |
| EBM 원인 해석 | alcohol ↑, volatile acidity ↓ 가 핵심. shape function으로 비선형 임계점 확인. | MedInc ↑, Latitude/Longitude(지역) 가 집값 핵심. 지역 변수는 Confounder. | 상권 구매력, 프로모션 강도, 유동인구가 드라이버로 예상. 임계점 확인 필요. |
| DiCE What-if | "medium → high" — alcohol ↑, volatile acidity ↓, sulphates ↑ 조합이 최다 등장. | (Housing에서는 DoWhy 집중, DiCE 생략) | "매출 하위 점포를 상위 수준으로" — 프로모션 수, 영업시간, 발주 패턴 조정 시나리오. |
| DoWhy 인과 검증 | (Wine에서는 EBM+DiCE 집중, DoWhy 생략) | MedInc → MedHouseVal ATE +$35,390. Lat/Long은 confounder. 인과 효과 유지. | 상권 구매력 → 매출 ATE 추정. 입지 유형(역세권/주거지)은 confounder. primary index 확정. |
| Actionable 피처 | alcohol, sulphates, citric acid (제조 단계 조절 가능) | 해당 없음 (집값 시나리오 분석 안 함) | 프로모션 수, 영업시간, 발주 빈도, 신상품 도입 수 (점장 의사결정 범위) |
| Non-actionable 피처 | density, fixed acidity (포도 품종 특성) | Latitude, Longitude (위치 고정) | 입지 유형, 경쟁점 수, 날씨, 공휴일 (변경 불가) |
편의점 EBM 피처 설계서 — 다음 스프린트 준비
ℹ️ 이 표는 지금 완성하지 않아도 됩니다. 브리지 세션에서 팀이 함께 초안을 채우고, 다음 스프린트 전에 데이터 담당자와 확인해서 확정합니다. 지금은 "어떤 피처가 필요한지"를 인식하는 것이 목적입니다.
편의점 매출 EBM — 피처 후보 목록 (Target: daily_sales 일매출)
| 피처 | 설명 | 역할 |
|---|---|---|
| 📍 입지 & 상권 특성 | ||
| location_type | 입지 유형 (역세권 / 주거지 / 오피스 / 학원가 / 복합) | Confounder |
| nearby_competitors | 반경 300m 내 경쟁 편의점 수 | Confounder |
| foot_traffic | 시간대별 유동인구 (통신 데이터 또는 POS 추정) | Primary 후보 |
| area_income_level | 상권 소득 수준 (= Housing의 MedInc 역할) | Primary 후보 |
| 🗓️ 시간 & 날씨 | ||
| day_of_week | 요일 (월–일) | Secondary |
| is_holiday | 공휴일 여부 (1/0) | Non-actionable |
| temperature | 일평균 기온 (°C) — 음료·아이스크림 수요 직결 | Non-actionable |
| precipitation | 강수량 (mm) — 방문객 수에 영향 | Non-actionable |
| 🏷️ 프로모션 & 운영 | ||
| promo_sku_count | 당일 1+1 / 2+1 행사 상품 수 | Actionable |
| new_product_count | 당월 신상품 도입 SKU 수 | Actionable |
| operating_hours | 일 영업시간 (24시간 / 단축 운영) | Actionable |
| staff_count | 일평균 근무 직원 수 | Actionable |
| freshfood_sku_ratio | 신선식품 SKU 비율 (%) — 도시락·샌드위치 등 | Actionable |
| 🛒 고객 & 구매 행동 | ||
| daily_visitors | 일 방문객 수 (POS 거래건수 추정) | Secondary |
| avg_basket_size | 평균 객단가 (원) — daily_sales / visitors | Secondary |
| loyalty_member_ratio | 앱 회원 결제 비율 (%) — 재방문 고객 지표 | Secondary |
편의점 DoWhy DAG 초안
| 역할 | 변수 | Housing 대응 |
|---|---|---|
| Treatment (처치) | promo_sku_count (행사 상품 수) | MedInc |
| Outcome (결과) | daily_sales (일매출) | MedHouseVal |
| Confounder (교란) | location_type, is_holiday, temperature | Latitude, Longitude |
| Secondary | day_of_week, foot_traffic | HouseAge, AveOccup |
3-2 · 팀별 발표
발표 형식
팀별 발표는 아래 구조를 따릅니다. 발표 자료는 오늘 실습에서 나온 shape function 차트와 DiCE 시나리오를 그대로 활용합니다.
| 발표 항목 | 내용 | 소요 |
|---|---|---|
| ① EBM 인사이트 | 와인 품질 Top 3 피처 + shape function 임계점 | 2분 |
| ② DiCE 시나리오 | "medium → high 전환" 최적 레시피 1가지 선택 & 이유 | 2분 |
| ③ DoWhy 결과 | ATE 수치 + "Latitude vs MedInc: 무엇이 진짜 원인인가" 해석 | 2분 |
| ④ 편의점 연결 | primary index 후보 1개 + DoWhy DAG 초안 설명 | 2분 |
| ⑤ Q&A | 청중 질의 | 2분 |
✅ 좋은 발표의 기준: 숫자를 비즈니스 언어로 번역할 수 있는가? "ATE +0.35"가 아니라 "소득 $10K 증가 시 집값 평균 $35,000 상승"처럼 말할 수 있어야 합니다.
3-3 · KPT 회고 & 마무리
KPT 회고
✅ Keep — 좋았던 것
- EBM·DiCE·DoWhy 직접 코드로 체험
- 상관 → 인과 사고 전환 경험
- AI와 모델링하는 워크플로우 체득
- 가설 수립 → 실험 → 조정 경험
⚠️ Problem — 아쉬웠던 것
- 기초 통계 지식 부족
- 시간 부족 (Part 3 못 간 케이스)
- ATE 수치 → 비즈니스 연결 어려움
- VPN/방화벽 환경 이슈
🚀 Try — 다음에 해볼 것
- 기초 선행학습 (AUC, RMSE 등)
- LightGBM → EBM 대체 시도
- DoWhy 실무 과제 적용
- Papermill로 리포트 자동화
✅ 워크샵 마무리: 오늘 여러분은 상관관계와 인과관계의 차이를 코드로 체험했습니다. EBM의 feature importance는 "관련이 있는 것"을 보여주고, DoWhy의 ATE는 "실제로 원인인 것"을 보여준다는 차이를 기억하세요. 편의점 데이터에서 이 차이가 비즈니스 의사결정을 바꿉니다.