Aprendizaje supervisado y aprendizaje no supervisado

Publicado por en

Los modelos de aprendizaje automático se pueden dividir en dos grandes familias: aprendizaje no supervisado. La principal diferencia entre estas dos familias se encuentra en los datos de entrenamiento. En el aprendizaje supervisado los resultados que se desean obtener del modelo son conocidos previamente. Siendo utilizados para guiar su entrenamiento. Por otro lado, en el aprendizaje no supervisado el resultado deseado no se utiliza durante el entrenamiento. En la mayoría de los casos tampoco se conoce previamente, siendo descubierto durante el proceso aprendizaje. aprendizaje supervisado y

Aprendizaje supervisado

En el entrenamiento de los algoritmos de aprendizaje supervisado, además de los datos necesarios para realizar la predicción, es necesario disponer de una característica objetivo para cada una de las instancias. Siendo este el valor que el modelo ha de reproducir. Pudiendo ser este un valor tanto de tipo numérico como categórico. Una vez finalizado el proceso de entrenamiento, el valor objetivo ya no es necesario, ya que es la predicción que realiza el modelo. Solamente son necesarias el resto de las características. A partir de este momento, el valor objetivo únicamente se suele utilizar en los procesos de validación. Para comprobar si el modelo sigue siendo valido.

Clasificación

El aprendizaje supervisado es bastante común en problemas de clasificación en los que se desea obtener una categoría. Por ejemplo, son adecuados para la detección del fraude. En estos problemas se utilizan todos los datos de una operación y se busca predecir si esta es fraudulenta o legitima. Otro problema típico es el reconocimiento de caracteres en imágenes. En estos la entrada es un mapa de bits y el resultado es cualquiera de los posibles caracteres de un alfabeto.

Regresión

Otras situaciones en los que el aprendizaje supervisado es bastante habitual son en los problemas de regresión. En estos se intenta predecir un valor continuo. Por ejemplo, se puede intentar predecir las unidades producidas en una factoría en base a diferentes factores que afecten a esta. En general, el aprendizaje supervisado es adecuado para los problemas en los que se puede conocer, por lo menos para el conjunto de datos de entrenamiento, el valor o categoría que le corresponde a cada uno de los registros.

Proceso de entrenamiento

Independientemente del problema, el aprendizaje se realiza mediante la minimización del error que comente el modelo sobre el conjunto de datos de entrenamiento. Aunque solamente minimizando el error no se puede garantizar un aprendizaje correcto. Pudiendo suceder que el modelo memorice los resultados, lo que se conoce como sobreajuste. Al memorizar los datos de entrenamiento la precisión obtenida es muy alta en este conjunto, pero suele ser baja fuera de los mismos. Este efecto se observa cuando el modelo utilizado es demasiado complejo para los datos. Por otro lado, cuando en los datos una de las categorías domina sobre el resto, el modelo puede asignar todas las respuestas a la clase mayoritaria para minimizar el error. Esto es lo que se conoce como el problema de desequilibrio de clases.

El sobreajuste se resuelve reduciendo la complejidad del modelo, lo que conduce a modelos menos precisos en el conjunto de entrenamiento. Pero más realistas precisos en otros conjuntos de datos. Para el problema de desequilibrio de clases es necesario equilibrar las clases en las muestras.

Aprendizaje no supervisado

A diferencia de los algoritmos de aprendizaje supervisado, en los no supervisados no es necesario disponer de la respuesta correcta en los datos de entrenamiento. Ya que no se busaca la reproducción de un resultado conocido, sino el descubrimiento de nuevos patrones o resultados.

Estos problemas aparentan ser más complejos que los anteriores. Ya que se espera que el modelo aprenda sin decirle el qué. Los problemas más habituales en este tipo de aprendizaje son los de clúster. En estos se busca grupos de registros que son similares entres si y, al mismo tiempo, diferentes del resto. Una vez obtenidos los grupos se le ha de asignar una clasificación a cada uno, la cual puede ser conocida o no antes de entrenar el modelo. Lo que muchas veces lleva al descubrimiento de patrones desconocidos. Por ejemplo, en una tienda la agrupación de clientes puede llevar a diferencias entre los clientes fieles o de conveniencia. Descubriendo al mismo tiempo otras categorías de estos que se desconocían previamente. Estos nuevos grupos se pueden utilizar posteriormente para realizar campañas especificas al poder identificar sus intereses y preferencias comunes.

Aprendizaje por refuerzo

Otro de los problemas habituales de este tipo son los que se resuelven mediante el aprendizaje por refuerzo. En estos problemas no se conoce la solución y la forma de entrenar el modelo es mediante la introducción de refuerzos positivos o negativos en función en función de los resultados. Provocando de esta forma que el modelo pueda tomar una decisión, no predecir una categoría o un valor numérico.

La utilizad de este enfoque se encuentra en problemas para los que se puede asignar una recompensa o penalizaciones, pero no se conoce cómo llegar al resultado. El mejor proceso para llegar al resultado es lo que lo descubre el algoritmo, ya que conoce las recompensa o la penalización asociada a cada una de sus posibles acciones y resultados. Una de sus posibles aplicaciones es en juegos, por ejemplo, el ajedrez. En estas el modelo conoce el valore de cada pieza y las posibles recompensas de sus acciones.

Conclusiones

En esta entrada se ha visto la diferencia entre las principales familias de aprendizaje que existen en el aprendizaje automático: aprendizaje supervisado y aprendizaje no supervisado. En el caso del supervisado se lo que se busca es reproducir un valor conocido en un conjunto de datos de entrenamiento. Por otro lado, en el no supervisado lo que se intenta encontrar patrones nuevos, que en muchos casos no son conocidos antes de entrenar el modelo.