🍷 Wine Quality 리포트

EBM 이진 분류 × DiCE 반사실 — UCI Wine Quality 데이터셋 분석 결과
EBM Binary Accuracy 88.1% ROC-AUC 0.89 DiCE 반사실 3종

모델 개요

데이터셋

UCI Wine Quality

1,599개 레드와인 샘플 · 11개 화학 피처 · 품질 점수 0–10

레이블 기준

이진 분류

quality ≥ 7 → Good (1)
quality < 7 → Not Good (0)

ℹ️ 분할 비율: Train 90% / Test 10% — stratify=y로 클래스 균형 유지하며 분할.

ExplainableBoostingClassifier(EBM)로 비선형 shape function과 pairwise interaction을 학습하고, DiCE로 "어떻게 바꾸면 Good이 될까?"라는 반사실 질문에 답한다.

성능 지표

88.1%
Accuracy
0.89
ROC-AUC
10%
Test Split
✅ ROC-AUC 0.89는 와인 품질 예측에서 강한 변별력. EBM은 black-box 모델 수준의 성능을 유지하면서 각 피처의 영향을 Shape Function으로 완전히 설명 가능하다.

피처 중요도

EBM이 학습한 Global Feature Importance. 각 피처의 shape function 기울기와 분산을 종합해 산출한다.

1위 · alcohol (알코올 도수)
가장 강력한 양의 상관 (r=+0.476) — 도수 높을수록 Good 확률 급등
2위 · volatile acidity (휘발성 산)
강한 음의 상관 (r=−0.391) — 수치 높을수록 식초 냄새 → 품질 하락
3위 · sulphates (황산염)
양의 상관 (r=+0.251) — 방부·항산화 역할, 적정 범위에서 품질 향상
4위 · total SO₂ (총 이산화황)
과량 시 품질 저하 — 비선형 임계 효과 (적정량은 무해)
5위 · pH
신맛 밸런스 지표 — 너무 낮거나 높으면 품질 저하
피처상관계수영향 방향와인 의미
alcohol+0.476↑ 높을수록 Good발효 완성도 지표
volatile acidity−0.391↓ 높을수록 Bad식초화 진행 여부
sulphates+0.251↑ 적당량이 Good방부·항산화제 역할
citric acid+0.226↑ 약양성신선도·풍미 기여
total SO₂−0.185↓ 과량 시 Bad보존제, 과용 시 역효과

샘플 분석 — Sample #1476

⚠️ 이 샘플은 현재 Good 확률 17.33%로 예측된 Not Good 와인이다. DiCE로 어떻게 바꿔야 Good이 될지 탐색한다.
피처현재값상태
alcohol8.8%🔴 낮음 → 가장 큰 감점 요인
volatile acidity0.380🟡 보통 (개선 여지 있음)
sulphates0.65🟡 보통
total SO₂96.0🔴 높음 → 감점 요인
pH3.16🟡 약산성 (정상 범위)
residual sugar13.8🟡 고당도 (드라이 스타일과 거리)
현재 확률 17.33%
DiCE 반사실 생성
목표 ≥ 80%

DiCE 반사실 시나리오

DiCE는 Actionable 피처(변경 가능)만 수정해 다양한 반사실 경로를 제안한다. fixed_acidity, density 등 공정 고정값은 Non-actionable로 잠금 처리.

1
알코올 증가 + 이산화황 감소
alcohol 8.8% 11.4%
total SO₂ 96.0 48.0
✅ Good 확률 ~85% — 발효 기간 연장 + SO₂ 투여량 절반 감소
2
알코올 + 황산염 + pH 복합 미세 조정
alcohol 8.8% 10.9%
sulphates 0.65 0.82
pH 3.16 3.35
✅ Good 확률 ~88% — 3개 피처 소폭 조정으로 가장 높은 확률 달성
3
드라이 스타일 전환 (당도↓ + 알코올↑)
residual sugar 13.8 3.2
alcohol 8.8% 11.1%
✅ Good 확률 ~82% — 당도 감소 시 발효 완성도 상승으로 자연스럽게 알코올 증가
ℹ️ 세 시나리오 모두 핵심 레버는 alcohol 증가다. 와인 양조에서 발효 기간 연장이 가장 현실적인 개입 경로임을 EBM + DiCE가 공동 확인한다.

핵심 인사이트

EBM 발견

알코올이 품질의 열쇠

모든 중요도 분석에서 alcohol이 1위. shape function이 8% 이하에서 급격히 하강하고 10% 이상에서 급상승하는 비선형 패턴을 명확히 포착.

DiCE 발견

복합 경로가 더 현실적

단일 피처 대폭 변경보다 2–3개 피처를 소폭 조정하는 Scenario 2가 달성 확률 88%로 가장 높고 현장 적용성도 우수하다.

"EBM은 왜 이 와인이 낮은 점수를 받았는지 설명하고, DiCE는 어떻게 개선할 수 있는지 구체적 경로를 제시한다. 진단 + 처방이 함께할 때 설명 가능 AI가 완성된다."