Evaluación del rendimiento de los modelos de clasificación de machine learning

Las curvas ROC (característica operativa del receptor) constituyen una herramienta importante para evaluar el rendimiento de un modelo de machine learning. Por lo general, se utilizan en problemas de clasificación binaria, concretamente, problemas con dos clases de salidas distintas. La curva ROC muestra la relación entre la tasa de verdaderos positivos (TPR) y la tasa de falsos positivos (FPR) del modelo. TPR describe la tasa a la que el clasificador predice como “positivo” a las observaciones que son “positivas”. FPR describe la tasa a la que el clasificador predice como “positivo” a las observaciones que en realidad son “negativas”. Los clasificadores perfectos tienen una TPR de 1 y una FPR de 0.

Las curvas ROC se pueden calcular en MATLAB® con la función perfcurve de Statistics and Machine Learning Toolbox™. Además, la app Classification Learner genera curvas ROC que ayudan a evaluar el rendimiento del modelo. La app permite especificar la representación de diferentes clases, de forma que pueda ver curvas ROC para problemas de clasificación multiclase con más de dos clases de salidas distintas.

Cómo funcionan las curvas ROC

La mayoría de los modelos de machine learning para clasificación binaria no generan solo 1 o 0 cuando hacen una predicción. En realidad, generan un valor continuo en un intervalo [0,1]. Los valores iguales o superiores a un determinado umbral (por ejemplo, 0,5) se clasifican como 1 y los valores por debajo de ese umbral se clasifican como 0. Los puntos de la curva ROC representan la FPR y la TPR para diferentes umbrales.

El umbral seleccionado puede encontrarse en cualquier punto del intervalo [0,1], y las clasificaciones resultantes cambiarán según el valor del umbral. Por ejemplo, si el umbral se establece como 0 (cualquier valor igual o superior a 0 se clasifica como 1), el modelo siempre predecirá 1, dando como resultado una TPR de 1 y una FPR de 1. En el otro extremo de la curva ROC, si el umbral se establece como 1 (cualquier valor por debajo de 1 se clasifica como 0), el modelo siempre predecirá 0, dando como resultado una TPR de 0 y una FPR de 0.

Al evaluar el rendimiento de un modelo de clasificación, el enfoque reside en el comportamiento entre extremos. En general, cuanto más “arriba y a la izquierda” del diagrama se encuentre la curva ROC, mejor será el clasificador.

Las curvas ROC se utilizan normalmente con validación cruzada para evaluar el rendimiento del modelo con datos de validación o prueba.

Curvas ROC calculadas con la función perfcurve (de izquierda a derecha): clasificador perfecto, clasificador típico y clasificador equivalente a una suposición aleatoria.

También puede consultar estos temas: validación cruzada, machine learning