NLP

Confusion Matrix, Accuracy, Precision, Recall, F1 score

still..epochs 2023. 8. 2. 00:36

Confusion Matrix 는 이진 분류(Binary Classification) 문제에서 모델의 성능을 평가하기 위해 사용되는 테이블 형태의 표이다.

출처 : https://towardsdatascience.com/confusion-matrix-for-your-multi-class-machine-learning-model-ff9aa3bf7826

  1. True Positive(TP) : 모델이 Positive 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 정확하게 Positive로 예측한 경우를 의미한다.
  2. False Positive(FP) : 모델이 Negative 클래스를 Positive 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제로는 Nagative인 샘플을 모델이 Positive로 잘못 예측한 경우를 의미한다.
  3. True Negative(TN) : 모델이 Negative 클래스로 정확하게 예측한 샘플의 수이다. 즉, 실제 Negative인 샘플을 모델이 정확하게 Negative로 예측한 경우를 의미한다.
  4. False Negative(FN) : 모델이 Positive 클래스를 Negative 클래스로 잘못 예측한 샘플의 수이다. 즉, 실제 Positive인 샘플을 모델이 Negative로 잘못 예측한 경우를 의미한다.
  • 정확도(Accuracy) : (TP + TN) / (TP + TN + FP + FN)
  • 정밀도(Precision) : TP / (TP + FP) 
    • 모델이 Positive로 예측한 샘플 중에서 실제로 Positve인 샘플의 비율을 나타낸다. 즉, Positive 클래스로 예측한 샘플 중에서 실제로 얼마나 맞추었는지를 평가한다.
  • 재현율(Recall) : TP / (TP + FN)
    •  Positive인 샘플 중에서 모델이 양성으로 예측한 샘플의 비율을 나타낸다. 즉, Positive 클래스 중에서 얼마나 많은 샘플을 모델이 식별해냈는지를 평가한다.
  • F1 score : 2 * (Precision * Recall ) / (Precision + Recall)
    • F1 score는 정밀도와 재현율의 조화 평균으로 계산된다. 이는 정밀도와 재현율 모두를 동시에 고려하여 모델의 성능을 평가하는 지표이다. F1 score는 정밀도와 재현율이 모두 높을 때 상대적으로 높은 값을 가진다.

 

'NLP' 카테고리의 다른 글

Kfold( Cross Validation 교차검증 )  (0) 2023.08.03
Model 평가 및 지표들  (0) 2023.07.31
reset_index() 사용 방법  (0) 2023.07.27