📖 챕터 3 — 분류: 기본 개념과 기법
다음 두 노드의 지니 지수를 각각 계산하고, 어느 노드가 더 순수한지 판단하라.
---
| 노드 A | 노드 B | |
|---|---|---|
| C1 (양성) | 1 | 3 |
| C2 (음성) | 5 | 3 |
📝 상세 풀이
노드 A (n=6, C1=1, C2=5):
$$\text{Gini}(A) = 1 - \left(\frac{1}{6}\right)^2 - \left(\frac{5}{6}\right)^2 = 1 - \frac{1}{36} - \frac{25}{36} = \frac{10}{36} \approx \mathbf{0.278}$$
노드 B (n=6, C1=3, C2=3):
$$\text{Gini}(B) = 1 - \left(\frac{3}{6}\right)^2 - \left(\frac{3}{6}\right)^2 = 1 - \frac{1}{4} - \frac{1}{4} = \mathbf{0.5}$$
판단: 노드 A의 지니(0.278) < 노드 B의 지니(0.5) → 노드 A가 더 순수하다.
지니 지수가 0에 가까울수록 한 클래스가 지배적(순수)이다.