Confusion Matrix, Accuracy, Precision, Recall, F1 score

NLP

still..epochs 2023. 8. 2. 00:36

Confusion Matrix 는 이진 분류(Binary Classification) 문제에서 모델의 성능을 평가하기 위해 사용되는 테이블 형태의 표이다.

True Positive(TP) : 모델이 Positive 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 정확하게 Positive로 예측한 경우를 의미한다.
False Positive(FP) : 모델이 Negative 클래스를 Positive 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제로는 Nagative인 샘플을 모델이 Positive로 잘못 예측한 경우를 의미한다.
True Negative(TN) : 모델이 Negative 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Negative인 샘플을 모델이 정확하게 Negative로 예측한 경우를 의미한다.
False Negative(FN) : 모델이 Positive 클래스를 Negative 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 Negative로 잘못 예측한 경우를 의미한다.

정확도(Accuracy) : (TP + TN) / (TP + TN + FP + FN)
정밀도(Precision) : TP / (TP + FP)
- 모델이 Positive로 예측한 샘플 중에서 실제로 Positve인 샘플의 비율을 나타낸다. 즉, Positive 클래스로 예측한 샘플 중에서 실제로 얼마나 맞추었는지를 평가한다.
재현율(Recall) : TP / (TP + FN)
- Positive인 샘플 중에서 모델이 양성으로 예측한 샘플의 비율을 나타낸다. 즉, Positive 클래스 중에서 얼마나 많은 샘플을 모델이 식별해냈는지를 평가한다.
F1 score : 2 * (Precision * Recall ) / (Precision + Recall)
- F1 score는 정밀도와 재현율의 조화 평균으로 계산된다. 이는 정밀도와 재현율 모두를 동시에 고려하여 모델의 성능을 평가하는 지표이다. F1 score는 정밀도와 재현율이 모두 높을 때 상대적으로 높은 값을 가진다.

python, 코린이, 머신러닝, 코딩, 밑바닥부터시작하는딥러닝, 파이썬, AI, 코딩연습, 알고리즘풀이, 프로그래머스, boj, 딥러닝, 백준, 사이킷런, PCA, 코딩테스트, pandas, 머신러닝교과서, 알고리즘, 다이나믹프로그래밍,

AI 개발자가 되어보자