Los avances recientes de la inteligencia artificial (IA) ha hecho que esta aparezca de forma habitual en los medios de comunicación generalistas. Algo que puede haber ayudado a producir malentendidos y mitos sobre la IA. Uno de los mitos más comunes entre el público general es que "todos los sistemas de IA son iguales". En esta entrada, se abordará y desmontará este mito, explicando las diferencias existentes entre los diversos tipos de IA.
Origen del mito "todos los sistemas de IA son iguales"
La mayoría de las personas, como es de esperar, no están familiarizadas con los detalles técnicos en los que se basan los sistemas de IA. Solamente los expertos conocen estos detalles. Al igual que en otros campos, este desconocimiento puede llevar a una percepción simplificada y monolítica de lo que es la IA, sin distinguir entre sus diferentes tipologías.
Mito que, como otros, refuerza el tratamiento que se le da a la IA en los medios de comunicación y la ciencia ficción.
Medios de comunicación
Los medios de comunicación a menudo presentan la IA de una manera sensacionalista y homogénea, sin explicar las diferencias entre los distintos tipos de sistemas de IA. Focalizando principalmente en los aspectos más espectaculares y vistosos de la IA. Este tipo de cobertura contribuye a la confusión y refuerza la idea errónea de que todos los sistemas de IA son iguales.
Influencia de la ciencia ficción
Al igual que otros avances técnicos como la robótica, la ciencia ficción también ha influido en la percepción errónea por parte del público de la IA. Presentándola frecuentemente como una entidad monolítica con capacidades sobrehumanas. Creando unas representaciones simplificadas de la IA que no reflejan la realidad de esta, siendo en la realidad una disciplina compleja y que requiere de diferentes perfiles y habilidades.
Diferentes tipos de IA
La IA se puede diferenciar en función de su alcance, diferenciando entre la IA débil o estrecha y la fuerte o de propósito general, y del tipo de aprendizaje (supervisado, no supervisado o por refuerzo).
IA débil frente a IA fuerte
IA débil (o estrecha)
La IA débil, también conocida como IA estrecha, se diseña y entrena para realizar correctamente tareas específicas. Modelos expertos en un área que no puede ser usada en otras. Por ejemplo, los asistentes virtuales como Siri y Alexa, los sistemas de recomendación en plataformas de streaming como Netflix, y los chatbots de atención al cliente. Cada uno de estos sistemas solamente pude resolver un problema específico:
- Asistentes virtuales: Sus funciones son realizar tareas como responder preguntas, establecer recordatorios y controlar dispositivos domésticos inteligentes.
- Sistemas de recomendación: Solamente están entrenadas para sugerir contenido basado en las preferencias y el historial del usuario.
- Chatbots de atención al Cliente: Son capaces únicamente de proporcionar respuestas automatizadas a preguntas frecuentes y puede manejar consultas simples.
IA Fuerte (o de propósito general)
La IA fuerte, o inteligencia artificial general (AGI), hace referencia a sistemas hipotéticos que pueden realizar cualquier tarea cognitiva humana. Sistemas que, hoy en día, no existen. A diferencia de la IA débil, la AGI podría generalizar conocimientos y habilidades para resolver problemas en una amplia variedad de tareas. Sin embargo, esta forma de IA no se espera que se desarrolle en el futuro cercano.
Comparación de la IA débil frente a una IA Fuerte
En un campo como la asistencia sanitaria se puede ver cuál sería la diferencia entre las IA débiles, las que existen ahora mismo, y las IA fuertes, en caso de que se puedan desarrollar en un futuro. Las diferencias básicas entre estas IA son:
- IA débil: Los sistemas actuales de IA débil pueden analizar imágenes médicas para detectar anomalías como tumores. Sin embargo, estos modelos no se pueden usar para otras tareas como evaluar análisis de sangre o evaluar el historial del paciente. Es necesario crear un modelo para cada problema.
- IA fuerte: Un sistema de IA fuerte, en el caso de que se pudiese crear, podría no solo diagnosticar enfermedades a partir de múltiples tipos de datos (imágenes, análisis de sangre, historial médico) sino también recomendar tratamientos personalizados y adaptarse a nuevos descubrimientos médicos, incluso realizarlos, de manera completamente autónoma.
Tipos de aprendizaje en IA
En base al tipo de aprendizaje usado para entrenar los modelos, la IA se puede dividir en tres clases fundamentales: aprendizaje supervisado, no supervisado y por refuerzo.
Aprendizaje supervisado
En aprendizaje supervisado, los modelos de IA se entrenan utilizando un conjunto de datos etiquetados. Cada entrada del conjunto de datos de entrenamiento necesita disponer de la respuesta correcta y el modelo aprende los patrones que relacionan los datos con las respuestas a partir de los ejemplos. Algunos casos en los que se usa aprendizaje supervisado son:
- Clasificación de imágenes: los modelos se entrenan con conjuntos de imágenes etiquetadas con las categorías correctas. Así, una vez finalizado el proceso de entrenamiento, son capaces de identificar y clasificar los objetos dentro de las imágenes, como diferenciar entre gatos y perros.
- Predicción de precios de viviendas: los modelos se entrenan con los precios históricos de ventas de viviendas y sus datos de sus características. En este caso, los modelos resultantes pueden estimar el valor de una vivienda basándose en características como el tamaño, la ubicación y el número de habitaciones.
Aprendizaje no supervisado
A diferencia del aprendizaje supervisado, en el aprendizaje no supervisado, los modelos se entrenan utilizando datos sin la respuesta correcta. Es decir, datos sin etiquetar. Para estos modelos el objetivo es encontrar los patrones y estructuras subyacentes que se encuentran dentro de los conjuntos de datos. Algunas aplicaciones de estos modelos son:
- Análisis de clústeres: Los modelos analizan los datos y agrupa elementos similares sin necesidad de etiquetas predefinidas. Así, se puede segmentar clientes en diferentes grupos basados en su comportamiento de compra sin haberlos etiquetado previamente.
- Reducción de dimensionalidad: Utilizando técnicas para identificar redundancia en los datos, como puede ser el Análisis de Componentes Principales (PCA), es posible transformar los datos de un espacio a otro con menor dimensión. Permitiendo reducir el número de variables, al mismo tiempo que se preserva la mayor cantidad de información posible.
Aprendizaje por refuerzo
En el aprendizaje por refuerzo, los agentes (en este tipo de aprendizaje se emplea el término agente en lugar de modelo) aprenden a tomar decisiones mediante la interacción con un entorno. Para ello se les recompensa cuando realizan acciones correctas y se les penaliza cuando estas se consideran como incorrectas. Así, los agentes buscan estrategias para a maximizar la recompensa total y aprender a tomas las decisiones que correctas que maximizan estas. Algunas aplicaciones del aprendizaje por refuerzo son:
- Juegos de estrategia: el agente recibe recompensas por ganar partidas y penalizaciones por perderlas. Bajo este enfoque, el agente desarrollará estrategias para ganar la mayor cantidad de partidas y así poder maximizar la recompensa final.
- Control de robots y vehículos: los agentes aprenden a través de la interacción con el entorno y la retroalimentación de las acciones realizadas. Pudiendo aprender a controlar el movimiento de un robot para realizar tareas específicas como moverse en un entorno sin colisionar con los objetos.
Resumen de las diferencias entre aprendizaje supervisado, no supervisado y por refuerzo
Cada uno de los tipos de aprendizaje vistos se emplean para abordar diferentes tipos de problemas:
- Supervisado: Se utiliza cuando se dispone de datos etiquetados y el objetivo es predecir o clasificar nuevas entradas basándose en ejemplos anteriores. Es muy efectivo para tareas como el reconocimiento de imágenes o la detección de spam en correos electrónicos.
- No supervisado: Es una solución ideal para descubrir patrones ocultos en datos. Se utiliza en aplicaciones como la segmentación de clientes y la detección de anomalías en los sistemas de seguridad.
- Por refuerzo: Se aplica en entornos donde las decisiones deben optimizarse a través de interacción continua. Es crucial para aplicaciones como los videojuegos y el control de robots.
Conclusiones
El mito de que "todos los sistemas de IA son iguales" surge del desconocimiento y la simplificación excesiva de una tecnología compleja como es la IA. Como se ha visto en la entrada, existen diferentes tipos de IA con capacidades diferentes. La IA débil está diseñada para realizar tareas específicas, la que existe en la actualidad, mientras que la IA fuerte, que podría realizar cualquier tarea cognitiva humana, aún es un concepto hipotético.
Además, los métodos de aprendizaje en IA, como el supervisado, no supervisado y por refuerzo, se usan para abordar diferentes problemas. Comprender las diferencias es crucial para aprovechar al máximo el potencial de la IA y evitar malentendidos sobre sus capacidades y limitaciones.
Imagen de Alexandra_Koch en Pixabay