
π λͺ©μ°¨
λͺ¨λΈμ λ§λ€μλλ°, μ΄κ² μ’μ κ±΄μ§ λμ κ±΄μ§ μ΄λ»κ² μ μ μμκΉμ? μ λ΅μ ‘νκ° μ§ν’λ₯Ό 보λ κ±°μμ. μ±λ₯μ μμΉλ‘ λ§ν΄μ£Όλ λκ΅¬μ£ !
λ¨Έμ λ¬λ λͺ¨λΈμ μ©λμ λ°λΌ νκ·, λΆλ₯, λ€μ€ λΆλ₯ λ± λ€μνκ² λλκΈ° λλ¬Έμ, κ·Έμ λ§λ νκ° μ§νλ λ€λ₯΄κ² μ¬μ©λΌμ.
λ΄κ° μκ°νμ λ λͺ¨λΈλ³΄λ€ λ μ€μν κ² λ°λ‘ 'νκ° κΈ°μ€'μ΄μμ. μ΄λ€ μμΉλ‘ μ’κ³ λμ¨μ νλ¨νλλμ λ°λΌ κ²°κ³Ό ν΄μμ΄ μμ ν λ¬λΌμ§λκΉμ.
μ΄μ λΆν° λν μ§νμΈ MSE, RMSE, MAE, AUC, F1-score λ± κ°κ°μ΄ μ΄λ€ μν©μμ μ°μ΄λμ§ μ½κ² μ 리ν΄λ³Όκ²μ!
μ νκ° μ§νκ° μ€μνκ°?
λͺ¨λΈμ νμ΅μν€λ κ²λ§νΌ μ€μν κ² λ°λ‘ 'νκ°'μμ. μ±λ₯μ΄ μΌλ§λ μ’μμ§, μ΄λ€ μν©μμ μ μλνλμ§λ₯Ό μ λμ μΌλ‘ νμΈν΄μΌ νλκΉμ.
νκ° μ§νλ λͺ¨λΈμ μμΈ‘κ°κ³Ό μ€μ κ° μ¬μ΄μ μ°¨μ΄λ₯Ό μμΉλ‘ λνλ΄ μ£Όλ κΈ°μ€μ΄μμ. μ΄ μμΉλ₯Ό κΈ°μ€μΌλ‘ λͺ¨λΈμ μ ννκ±°λ κ°μ ν μ μμ£ .
λ¬Έμ μ νμ λ°λΌ νκ· λ¬Έμ , λΆλ₯ λ¬Έμ , λ€μ€ ν΄λμ€ λ¬Έμ λ±μΌλ‘ λλλ©°, κ°κ° λ€λ₯Έ μ§νλ₯Ό μ¬μ©ν΄μ. κ°μ μμΉλ₯Ό μ¨λ μλ―Έκ° λ€λ₯΄κΈ° λλ¬Έμ ꡬλΆμ΄ μ€μν΄μ.
λν νκ° μ§νλ λ¨μ μ νλλΏ μλλΌ μ λ°λ, μ¬νμ¨, μμ€ κ° λ± λ€μν κ΄μ μμ λͺ¨λΈμ μ΄ν΄νλ λ° λμμ μ€μ.
νκ· λ¬Έμ μ νκ° μ§ν
νκ· λͺ¨λΈμ μ°μλ μ«μ κ°μ μμΈ‘ν΄μ. μ: μ§κ°, λ μ¨, μ£Όμ κ°κ²© λ±. μ΄λ΄ λ μ€μ°¨λ₯Ό μ€μ¬μΌλ‘ λͺ¨λΈ μ±λ₯μ νκ°ν΄μ.
κ°μ₯ κΈ°λ³Έμ μΈ μ§νλ MSE(Mean Squared Error)μμ. μμΈ‘κ°κ³Ό μ€μ κ°μ μ°¨μ΄λ₯Ό μ κ³±ν΄ νκ· μ λΈ κ°μ΄μμ. μμμλ‘ μ±λ₯μ΄ μ’μ κ±°μ£ .
RMSE(Root MSE)λ MSEμ μ κ³±κ·Όμ μ·¨ν κ°μΌλ‘, μ€μ μ€μ°¨ λ¨μλ₯Ό κ·Έλλ‘ λ³Ό μ μμ΄μ μ§κ΄μ μ΄μμ. μ: μμΈ‘ μ€μ°¨κ° νκ· μ μΌλ‘ 1.2λ μ λλ€!
MAE(Mean Absolute Error)λ μ λ μ€μ°¨μ νκ· μ΄μμ. MSEλ³΄λ€ μ΄μμΉμ λ λ―Όκ°ν΄μ μμ μ μΈ νκ°κ° νμν λ μμ£Ό μ¬μ©λΌμ.
λΆλ₯ λ¬Έμ μ νκ° μ§ν
λΆλ₯ λ¬Έμ λ μ΄λ€ μΉ΄ν κ³ λ¦¬μ μνλμ§λ₯Ό λ§νλ λ¬Έμ μμ. μ€νΈλ©μΌ μ¬λΆ, μ μ§λ¨, κ³ κ° μ΄ν μμΈ‘ λ±μμ λ§μ΄ μ¬μ©λΌμ.
Accuracy(μ νλ)λ μ 체 μ€ λ§ν λΉμ¨μ΄μμ. μ§κ΄μ μ΄μ§λ§, λΆκ· ν λ°μ΄ν°μμ μ±λ₯μ μ λ°μνμ§ λͺ»ν΄μ.
Precision(μ λ°λ)μ 'λ§λ€κ³ ν κ² μ€ μ€μ λ‘ λ§μ λΉμ¨', Recall(μ¬νμ¨)μ 'μ€μ λ‘ λ§μμΌ νλ κ² μ€ μΌλ§λ λ§μ·λκ°'λ₯Ό μλ―Έν΄μ.
F1-scoreλ μ λ°λμ μ¬νμ¨μ μ‘°ν νκ· μΌλ‘, λ μ±λ₯μ ν¨κ» κ³ λ €ν μ μμ΄μ. λΆκ· ν λ°μ΄ν°μ νΉν μ€μν΄μ!
νΌλ νλ ¬κ³Ό μ νλ λΆμ
νΌλ νλ ¬(Confusion Matrix)μ λΆλ₯ κ²°κ³Όλ₯Ό νλ‘ μ λ¦¬ν΄ λ³΄μ¬μ€μ. μ€μ κ°κ³Ό μμΈ‘ κ°μ μ‘°ν©μΌλ‘ TP, FP, TN, FNμ μ μ μμ΄μ.
TP(True Positive): λ§λ€κ³ μμΈ‘ν΄μ λ§μ κ², FP(False Positive): νλ¦°λ° λ§λ€κ³ μμΈ‘ν κ², FN(False Negative): λ§λλ° νλ Έλ€κ³ μμΈ‘ν κ²μ΄μ£ .
μ΄ νλ₯Ό λ°νμΌλ‘ Accuracy, Precision, Recall, F1-scoreλ₯Ό κ³μ°ν μ μμ΄μ. λͺ¨λΈμ΄ μ΄λ€ μ€μλ₯Ό λ§μ΄ νλμ§λ μ μ μμ΄μ μ μ©ν΄μ.
μλ₯Ό λ€μ΄, μλ£ λΆμΌμμ FPλ³΄λ€ FN(μ€μ λ‘ μ§λ³μΈλ° λμΉ κ²½μ°)μ΄ λ μΉλͺ μ μΌ μ μμ΄μ Recallμ΄ λ μ€μνκ² μ¬κ²¨μ§κΈ°λ ν΄μ.
AUCμ ROC 곑μ μ΄ν΄νκΈ°
ROC(Receiver Operating Characteristic) 곑μ μ λ―Όκ°λ(Recall)μ 1-νΉμ΄λ(False Positive Rate)λ₯Ό μΆμΌλ‘ κ·Έλ¦° κ·Έλνμμ. λͺ¨λΈμ λΆλ₯ λ₯λ ₯μ μκ°νν΄μ.
AUC(Area Under Curve)λ ROC 곑μ μλ λ©΄μ μ λ§ν΄μ. 1μ κ°κΉμΈμλ‘ μλ²½ν λͺ¨λΈ, 0.5μ κ°κΉμΈμλ‘ λλ€ μμΈ‘μ΄λΌλ λ»μ΄μμ.
AUCλ λΆλ₯ μκ³κ°(threshold)μ λ³νμμΌλ μ±λ₯μ κ°κ΄μ μΌλ‘ λ³Ό μ μμ΄μ, μ΄μ§ λΆλ₯ λͺ¨λΈμμ κ°μ₯ λ리 μ¬μ©λΌμ.
νΉν λ°μ΄ν°κ° λΆκ· νν μν©μμλ AUCλ μ’μ λΉκ΅ κΈ°μ€μ΄ λ μ μμ΄μ. Accuracyλ§μΌλ‘λ μ¨κ²¨μ§ μ±λ₯μ λμΉ μ μκ±°λ μ.
μ§ν μ ν μ κ³ λ €μ¬ν
μ΄λ€ μ§νλ₯Ό μ¨μΌ ν μ§λ λ°μ΄ν°μ λ¬Έμ νΉμ±μ λ°λΌ λ¬λΌμ. λΆλ₯λ νκ·λ, κ· ν λ°μ΄ν°λ λΆκ· ν λ°μ΄ν°λμ λ°λΌ λ€λ₯΄κ² μ κ·Όν΄μΌ ν΄μ.
μλ₯Ό λ€μ΄ μ μ©μΉ΄λ λΆμ μ¬μ© νμ§μ²λΌ μμ± ν΄λμ€κ° μ μ κ²½μ°μ Accuracyλ³΄λ¨ Recallκ³Ό AUCκ° λ μ€μν΄μ.
νκ· λ¬Έμ μμ MSEλ μ΄μμΉμ λ―Όκ°νμ§λ§, MAEλ μ λ°μ μΈ νκ· μ€μ°¨λ₯Ό 보기 μ’μμ. μν©μ λ§κ² μ°λ κ² ν΅μ¬μ΄μμ.
μ¬λ¬ μ§νλ₯Ό ν¨κ» λ³΄κ³ , μ 체μ μΈ μ±λ₯μ μ 체μ μΌλ‘ μ΄ν΄νλ κ² κ°μ₯ μ’μμ!
π μ£Όμ λ¨Έμ λ¬λ νκ° μ§ν λΉκ΅ν
μ§ν | μ€λͺ | μ¬μ© μμ |
---|---|---|
MSE | μ€μ°¨ μ κ³±μ νκ· | νκ· (μ: μ£Όκ° μμΈ‘) |
F1-score | μ λ°λμ μ¬νμ¨μ μ‘°ν νκ· | λΆκ· ν λ°μ΄ν° λΆλ₯ |
AUC | ROC 곑μ μλ λ©΄μ | μ΄μ§ λΆλ₯ μ±λ₯ λΉκ΅ |
MAE | μ λκ° μ€μ°¨ νκ· | μ€μν μμΉ μμΈ‘ |
FAQ
Q1. MSEμ RMSE μ€ μ΄λ€ κ² λ μ’λμ?
A1. RMSEλ μ€μ μ€μ°¨ λ¨μλ₯Ό κ·Έλλ‘ λ³΄μ¬μ€μ ν΄μμ΄ μ¬μμ. μ§κ΄μ μΈ νκ°κ° νμν λ RMSEκ° μ’μμ.
Q2. Accuracyλ§ λ΄λ λμ§ μλμ?
A2. λΆκ· ν λ°μ΄ν°μμλ Accuracyκ° λμλ μ€μ λ‘ μ±λ₯μ΄ μ μ’μ μ μμ΄μ. Precision, Recallλ κΌ νμΈνμΈμ.
Q3. AUCκ° 0.5λ©΄ λ¬΄μ¨ λ»μΈκ°μ?
A3. 0.5λ μμ λλ€ μμΈ‘κ³Ό κ°λ€λ λ»μ΄μμ. λͺ¨λΈμ΄ μμΈ‘μ μνμ§ λͺ»νκ³ μλ€λ μ νΈμμ.
Q4. νκ· λͺ¨λΈμλ F1-scoreλ₯Ό μ°λμ?
A4. μλμμ! F1-scoreλ λΆλ₯ λ¬Έμ μ μ©μ΄μμ. νκ· λ¬Έμ μ MSE, RMSE, MAE λ±μ μ¬μ©ν΄μ.
Q5. ROC 곑μ μ μ΄λ€ μν©μμ μ μ©νμ£ ?
A5. μ΄μ§ λΆλ₯μμ λͺ¨λΈμ λ―Όκ°λμ νΉμ΄λλ₯Ό μκ°μ μΌλ‘ λΉκ΅ν λ μ μ©ν΄μ. μκ³κ° λ³νμ λ°λ₯Έ μ±λ₯ μ°¨μ΄λ₯Ό λ³Ό μ μμ΄μ.
Q6. Precisionκ³Ό Recall μ€ λκ° λ μ€μνκ°μ?
A6. μν©μ λ°λΌ λ¬λΌμ. μ€νΈ νν°λ Precisionμ΄ μ€μνκ³ , μ§λ³ κ²μΆμ Recallμ΄ λ μ€μν΄μ.
Q7. F1-scoreκ° λμΌλ©΄ μ’μ λͺ¨λΈμΈκ°μ?
A7. λ€, νΉν Precisionκ³Ό Recallμ κ· νμ΄ μ€μν λ F1-scoreκ° λλ€λ 건 μ’μ μ§μ‘°μμ.
Q8. λ€μ€ ν΄λμ€ λΆλ₯μλ AUCλ₯Ό μΈ μ μλμ?
A8. λ€! One-vs-Rest λ°©μμΌλ‘ κ° ν΄λμ€μ λν΄ AUCλ₯Ό ꡬν λ€ νκ· μ λ΄λ λ°©μμΌλ‘ μ μ©ν μ μμ΄μ.