🍷 Wine Quality 리포트
EBM 이진 분류 × DiCE 반사실 — UCI Wine Quality 데이터셋 분석 결과
EBM Binary
Accuracy 88.1%
ROC-AUC 0.89
DiCE 반사실 3종
모델 개요
데이터셋
UCI Wine Quality
1,599개 레드와인 샘플 · 11개 화학 피처 · 품질 점수 0–10
레이블 기준
이진 분류
quality ≥ 7 → Good (1)
quality < 7 → Not Good (0)
ℹ️ 분할 비율: Train 90% / Test 10% — stratify=y로 클래스 균형 유지하며 분할.
ExplainableBoostingClassifier(EBM)로 비선형 shape function과 pairwise interaction을 학습하고, DiCE로 "어떻게 바꾸면 Good이 될까?"라는 반사실 질문에 답한다.
성능 지표
88.1%
Accuracy
0.89
ROC-AUC
10%
Test Split
✅ ROC-AUC 0.89는 와인 품질 예측에서 강한 변별력. EBM은 black-box 모델 수준의 성능을 유지하면서 각 피처의 영향을 Shape Function으로 완전히 설명 가능하다.
피처 중요도
EBM이 학습한 Global Feature Importance. 각 피처의 shape function 기울기와 분산을 종합해 산출한다.
| 피처 | 상관계수 | 영향 방향 | 와인 의미 |
|---|---|---|---|
| alcohol | +0.476 | ↑ 높을수록 Good | 발효 완성도 지표 |
| volatile acidity | −0.391 | ↓ 높을수록 Bad | 식초화 진행 여부 |
| sulphates | +0.251 | ↑ 적당량이 Good | 방부·항산화제 역할 |
| citric acid | +0.226 | ↑ 약양성 | 신선도·풍미 기여 |
| total SO₂ | −0.185 | ↓ 과량 시 Bad | 보존제, 과용 시 역효과 |
샘플 분석 — Sample #1476
⚠️ 이 샘플은 현재 Good 확률 17.33%로 예측된 Not Good 와인이다. DiCE로 어떻게 바꿔야 Good이 될지 탐색한다.
| 피처 | 현재값 | 상태 |
|---|---|---|
| alcohol | 8.8% | 🔴 낮음 → 가장 큰 감점 요인 |
| volatile acidity | 0.380 | 🟡 보통 (개선 여지 있음) |
| sulphates | 0.65 | 🟡 보통 |
| total SO₂ | 96.0 | 🔴 높음 → 감점 요인 |
| pH | 3.16 | 🟡 약산성 (정상 범위) |
| residual sugar | 13.8 | 🟡 고당도 (드라이 스타일과 거리) |
현재 확률 17.33%
→
DiCE 반사실 생성
→
목표 ≥ 80%
DiCE 반사실 시나리오
DiCE는 Actionable 피처(변경 가능)만 수정해 다양한 반사실 경로를 제안한다. fixed_acidity, density 등 공정 고정값은 Non-actionable로 잠금 처리.
1
알코올 증가 + 이산화황 감소
alcohol
8.8%
→
11.4%
total SO₂
96.0
→
48.0
✅ Good 확률 ~85% — 발효 기간 연장 + SO₂ 투여량 절반 감소
2
알코올 + 황산염 + pH 복합 미세 조정
alcohol
8.8%
→
10.9%
sulphates
0.65
→
0.82
pH
3.16
→
3.35
✅ Good 확률 ~88% — 3개 피처 소폭 조정으로 가장 높은 확률 달성
3
드라이 스타일 전환 (당도↓ + 알코올↑)
residual sugar
13.8
→
3.2
alcohol
8.8%
→
11.1%
✅ Good 확률 ~82% — 당도 감소 시 발효 완성도 상승으로 자연스럽게 알코올 증가
ℹ️ 세 시나리오 모두 핵심 레버는 alcohol 증가다. 와인 양조에서 발효 기간 연장이 가장 현실적인 개입 경로임을 EBM + DiCE가 공동 확인한다.
핵심 인사이트
EBM 발견
알코올이 품질의 열쇠
모든 중요도 분석에서 alcohol이 1위. shape function이 8% 이하에서 급격히 하강하고 10% 이상에서 급상승하는 비선형 패턴을 명확히 포착.
DiCE 발견
복합 경로가 더 현실적
단일 피처 대폭 변경보다 2–3개 피처를 소폭 조정하는 Scenario 2가 달성 확률 88%로 가장 높고 현장 적용성도 우수하다.
"EBM은 왜 이 와인이 낮은 점수를 받았는지 설명하고, DiCE는 어떻게 개선할 수 있는지 구체적 경로를 제시한다. 진단 + 처방이 함께할 때 설명 가능 AI가 완성된다."