Confusion Matrix 는 이진 분류(Binary Classification) 문제에서 모델의 성능을 평가하기 위해 사용되는 테이블 형태의 표이다.
- True Positive(TP) : 모델이 Positive 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 정확하게 Positive로 예측한 경우를 의미한다.
- False Positive(FP) : 모델이 Negative 클래스를 Positive 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제로는 Nagative인 샘플을 모델이 Positive로 잘못 예측한 경우를 의미한다.
- True Negative(TN) : 모델이 Negative 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Negative인 샘플을 모델이 정확하게 Negative로 예측한 경우를 의미한다.
- False Negative(FN) : 모델이 Positive 클래스를 Negative 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 Negative로 잘못 예측한 경우를 의미한다.
- 정확도(Accuracy) : (TP + TN) / (TP + TN + FP + FN)
- 정밀도(Precision) : TP / (TP + FP)
- 모델이 Positive로 예측한 샘플 중에서 실제로 Positve인 샘플의 비율을 나타낸다. 즉, Positive 클래스로 예측한 샘플 중에서 실제로 얼마나 맞추었는지를 평가한다.
- 재현율(Recall) : TP / (TP + FN)
- Positive인 샘플 중에서 모델이 양성으로 예측한 샘플의 비율을 나타낸다. 즉, Positive 클래스 중에서 얼마나 많은 샘플을 모델이 식별해냈는지를 평가한다.
- F1 score : 2 * (Precision * Recall ) / (Precision + Recall)
- F1 score는 정밀도와 재현율의 조화 평균으로 계산된다. 이는 정밀도와 재현율 모두를 동시에 고려하여 모델의 성능을 평가하는 지표이다. F1 score는 정밀도와 재현율이 모두 높을 때 상대적으로 높은 값을 가진다.
'NLP' 카테고리의 다른 글
Kfold( Cross Validation 교차검증 ) (0) | 2023.08.03 |
---|---|
Model 평가 및 지표들 (0) | 2023.07.31 |
reset_index() 사용 방법 (0) | 2023.07.27 |