La curva ROC y el ave roc

Por Emilienko

Ustedes perdonarán que esté un poco pesado con todo este tema de los clasificadores; les prometo que, por ahora, ésta será la última entrega. Y dicho esto, pasemos al

Capítulo III

El hijo del doctor Sensible y la doctora Específica puso un ejemplo.

-Imaginemos que para aprobar un examen sólo hicieran falta 2 puntos sobre 10. ¿Qué ocurriría entonces?
-Los alumnos que saben Matemáticas aprobarían todos. La mayoría de los alumnos que saben Matemáticas tienen notas superiores al 5 y ésos estarían aprobados. Por otro lado, los alumnos que saben Matemáticas pero tuvieron mala suerte tendrán notas alrededor de un 3 o un 4. Nunca menos de un 2. ¡Aprobaríamos a todos los que saben! -dijo contento el doctor Sensible.
-Pero también aprobaríamos a muchos de los que no saben -apostilló la doctora Específica. Bastantes de los que no saben Matemáticas suficientes tendrán más de 2 puntos. El 2 no es la nota de corte óptima.

El hijo de ambos sonrió.

-Los has dicho muy bien, mamá. No es la nota de corte óptima. ¿Y si la nota de corte fuera un 3?
-Suspenderían muchos de los que se lo merecen -dijo ella.
-Sí, pero también suspendería algún pobre que sepa mucho pero con mala suerte -se apresuró a afinar él.

Y el hijo contestó lo siguiente.

-Ambos tenéis razón. Toda pérdida de sensibilidad implica un aumento de especificidad. Pero esto no ocurre de forma lineal. Al pasar la nota de corte del 2 al 3, muchos alumnos que no saben obtendrán su suspenso a costa de alguno raro que suspenderá sin merecerlo. En otras palabras, al pasar la nota de corte del 2 al 3, más alumnos quedarán correctamente clasificados en aprobados y suspensos según sus conocimientos.

La idea clave es que la ganancia de sensibilidad a costa de una pérdida de especificidad no es lineal, sino curva. Esa curva tiene nombre propio y se llama ROC, que dicho sea de paso, no tiene nada que ver con el roc, el ave mitológica cuyo huevo quiso colgar Aladino de la cúpula de su palacio o el que se encontró Simbad el marino en uno de sus viajes.

No quiero entrar en cuestiones estadísticas tediosas acerca de la curva; en Internet encontrarán fácilmente información sobre ella mucho mejor de la que yo puedo darles. Sin embargo, sí que les interesará conocer sus ventajas.

Por ejemplo, permite encontrar el punto de corte de una prueba, como el examen de Matemáticas, (o una prueba médica, como un valor bioquímico o fisiológico) con el cual el número de individuos mal clasificados sea mínimo. U otro punto de corte, por ejemplo en el cual no minimicemos el número de individuos mal clasificados, sino el coste que éstos suponen.

¿O se creían ustedes que los valores médicos de corte se establecían al azar?

Foto: Huevo de roc.