Session 03 · Part 3 · 16:15 – 18:00

편의점 매출 브리지
발표 & 회고

오늘 배운 것을 편의점 언어로 번역한다

🏪 105분 · 최종 파트 브리지 45분 + 발표 45분 + 회고 15분

편의점 브리지 · 발표 · 회고

오늘 하루의 학습 여정을 완성하고, 다음 스프린트 계획을 세웁니다.

오늘의 학습 여정 완성

방법론
소개
EBM
Wine 원인해석
DiCE
Wine What-if
S3
파이프라인
EBM
Housing 회귀
DoWhy
인과추론
🏪
편의점 적용
"오늘 여러분은 데이터가 바뀌어도 구조는 같다는 것을 직접 체험했습니다. Wine의 '알코올 → 품질'이 편의점의 '프로모션 → 매출'과 같은 형태입니다."

3-1 · 브리지 세션
16:15 – 17:00 · 45분 · 방법론 → 편의점 매출 전환

오늘 배운 것 총정리 — 3종 방법론 매핑표

구분🍷 Wine 데이터🏠 Housing 데이터🏪 편의점 매출 (다음 스프린트)
문제 유형분류 (low/mid/high 품질)회귀 (집값 중앙값)회귀 (일매출액, 단점포 단위)
타겟 변수quality_labelMedHouseValdaily_sales (일매출)
EBM 원인 해석alcohol ↑, volatile acidity ↓ 가 핵심. shape function으로 비선형 임계점 확인.MedInc ↑, Latitude/Longitude(지역) 가 집값 핵심. 지역 변수는 Confounder.상권 구매력, 프로모션 강도, 유동인구가 드라이버로 예상. 임계점 확인 필요.
DiCE What-if"medium → high" — alcohol ↑, volatile acidity ↓, sulphates ↑ 조합이 최다 등장.(Housing에서는 DoWhy 집중, DiCE 생략)"매출 하위 점포를 상위 수준으로" — 프로모션 수, 영업시간, 발주 패턴 조정 시나리오.
DoWhy 인과 검증(Wine에서는 EBM+DiCE 집중, DoWhy 생략)MedInc → MedHouseVal ATE +$35,390. Lat/Long은 confounder. 인과 효과 유지.상권 구매력 → 매출 ATE 추정. 입지 유형(역세권/주거지)은 confounder. primary index 확정.
Actionable 피처alcohol, sulphates, citric acid (제조 단계 조절 가능)해당 없음 (집값 시나리오 분석 안 함)프로모션 수, 영업시간, 발주 빈도, 신상품 도입 수 (점장 의사결정 범위)
Non-actionable 피처density, fixed acidity (포도 품종 특성)Latitude, Longitude (위치 고정)입지 유형, 경쟁점 수, 날씨, 공휴일 (변경 불가)

편의점 EBM 피처 설계서 — 다음 스프린트 준비

ℹ️ 이 표는 지금 완성하지 않아도 됩니다. 브리지 세션에서 팀이 함께 초안을 채우고, 다음 스프린트 전에 데이터 담당자와 확인해서 확정합니다. 지금은 "어떤 피처가 필요한지"를 인식하는 것이 목적입니다.

편의점 매출 EBM — 피처 후보 목록 (Target: daily_sales 일매출)

피처설명역할
📍 입지 & 상권 특성
location_type입지 유형 (역세권 / 주거지 / 오피스 / 학원가 / 복합)Confounder
nearby_competitors반경 300m 내 경쟁 편의점 수Confounder
foot_traffic시간대별 유동인구 (통신 데이터 또는 POS 추정)Primary 후보
area_income_level상권 소득 수준 (= Housing의 MedInc 역할)Primary 후보
🗓️ 시간 & 날씨
day_of_week요일 (월–일)Secondary
is_holiday공휴일 여부 (1/0)Non-actionable
temperature일평균 기온 (°C) — 음료·아이스크림 수요 직결Non-actionable
precipitation강수량 (mm) — 방문객 수에 영향Non-actionable
🏷️ 프로모션 & 운영
promo_sku_count당일 1+1 / 2+1 행사 상품 수Actionable
new_product_count당월 신상품 도입 SKU 수Actionable
operating_hours일 영업시간 (24시간 / 단축 운영)Actionable
staff_count일평균 근무 직원 수Actionable
freshfood_sku_ratio신선식품 SKU 비율 (%) — 도시락·샌드위치 등Actionable
🛒 고객 & 구매 행동
daily_visitors일 방문객 수 (POS 거래건수 추정)Secondary
avg_basket_size평균 객단가 (원) — daily_sales / visitorsSecondary
loyalty_member_ratio앱 회원 결제 비율 (%) — 재방문 고객 지표Secondary

편의점 DoWhy DAG 초안

역할변수Housing 대응
Treatment (처치)promo_sku_count (행사 상품 수)MedInc
Outcome (결과)daily_sales (일매출)MedHouseVal
Confounder (교란)location_type, is_holiday, temperatureLatitude, Longitude
Secondaryday_of_week, foot_trafficHouseAge, AveOccup

3-2 · 팀별 발표
17:00 – 17:45 · 45분 · 인사이트 공유 & 질의응답

발표 형식

팀별 발표는 아래 구조를 따릅니다. 발표 자료는 오늘 실습에서 나온 shape function 차트와 DiCE 시나리오를 그대로 활용합니다.

발표 항목내용소요
① EBM 인사이트와인 품질 Top 3 피처 + shape function 임계점2분
② DiCE 시나리오"medium → high 전환" 최적 레시피 1가지 선택 & 이유2분
③ DoWhy 결과ATE 수치 + "Latitude vs MedInc: 무엇이 진짜 원인인가" 해석2분
④ 편의점 연결primary index 후보 1개 + DoWhy DAG 초안 설명2분
⑤ Q&A청중 질의2분
좋은 발표의 기준: 숫자를 비즈니스 언어로 번역할 수 있는가? "ATE +0.35"가 아니라 "소득 $10K 증가 시 집값 평균 $35,000 상승"처럼 말할 수 있어야 합니다.

3-3 · KPT 회고 & 마무리
17:45 – 18:00 · 15분

KPT 회고

✅ Keep — 좋았던 것

  • EBM·DiCE·DoWhy 직접 코드로 체험
  • 상관 → 인과 사고 전환 경험
  • AI와 모델링하는 워크플로우 체득
  • 가설 수립 → 실험 → 조정 경험

⚠️ Problem — 아쉬웠던 것

  • 기초 통계 지식 부족
  • 시간 부족 (Part 3 못 간 케이스)
  • ATE 수치 → 비즈니스 연결 어려움
  • VPN/방화벽 환경 이슈

🚀 Try — 다음에 해볼 것

  • 기초 선행학습 (AUC, RMSE 등)
  • LightGBM → EBM 대체 시도
  • DoWhy 실무 과제 적용
  • Papermill로 리포트 자동화
워크샵 마무리: 오늘 여러분은 상관관계와 인과관계의 차이를 코드로 체험했습니다. EBM의 feature importance는 "관련이 있는 것"을 보여주고, DoWhy의 ATE는 "실제로 원인인 것"을 보여준다는 차이를 기억하세요. 편의점 데이터에서 이 차이가 비즈니스 의사결정을 바꿉니다.