Revista Comunicación

Captchas; origen, evolución y porqué son tan complicados

Publicado el 29 mayo 2021 por Cristianmonroy
Captchas; origen, evolución y porqué son tan complicados

Pocas cosas son tan frustrantes en el escenario digital como el hecho de qué te encuentres con un captcha y el sitio o formulario no te reconozca como un humano, pidiéndote que lo hagas de nuevo.

Sin embargo la existencia de los captchas tiene un objetivo, la pregunta es sí todavía es válido.

Su origen se remonta al año 2000 de la mano de Yahoo, en ese momento una de las empresas digitales más emblemáticas.

Surgen como una solución al hecho de que algunas personas comenzaron a escribir programas que registraban cuentas en Yahoo de manera automática, millones de cuentas.

La idea era crear una prueba capaz de distinguir un humano de una máquina.

Por supuesto la prueba debía funcionar independientemente de la edad, sexo, educación o idioma de las personas, en ese momento no era un reto menor.

Además imagina esto:

La prueba debía ser sencilla para un humano pero compleja para una máquina, por otro lado la máquina debería ser capaz de garantizar la solución.

Una idea un poco paradójica, después todo se trataba de algo nuevo.

La primera versión consistió en textos pre cargados a manera de respuestas, la máquina que contenía las respuestas podría saber la solución, las demás no lo sabrían.

En 2005 reCaptcha, la versión mejorada del primer captcha hizo su aparición.

Ahora había dos palabras, la primera generada por la máquina a partir de su base de respuestas, la segunda palabra era extraída de un libro, un artículo antiguo del New York Times, de tal manera que la máquina no tenía idea de cual era.

Cuando una persona contestaba bien la primera palabra, la máquina asumía que la segunda también sería correcta.

Para asegurarse de eso la máquina enviaba a distintas personas la misma combinación de palabras, si había consenso la palabra era aprobada.

Gracias a esa acción, un año de publicaciones del New York Times se digitalizaba en solo cuatro días.

En 2009 Google adquirió reCaptcha y lo utilizó para digitalizar sus libros escaneados y su archivo de noticias.

Pero vino el problema, con tal cantidad de información cargada en las máquinas éstas comenzaron a extrapolar su conocimiento a nuevas imágenes, básicamente los captchas enseñaron a las computadoras como leer textos complejos.

En 2014 Google realizó una prueba en la cuál se descubrió que un humano puede leer el texto distorsionado de los captchas con un 33% de acierto, por otro lado las máquinas lo hacían en ese momento con 99.8% de acierto.

Las computadoras se hicieron mejores que los humanos para responder los captchas.

En el mismo 2014 se introdujo reCaptcha v2 que utilizaba imágenes en vez de texto.

De nuevo, Google aprovecho la actualización para enseñar a las máquinas como identificar objetos de la vida real, aceras, semáforos, automóviles, etcétera.

Google utiliza estos datos para entrenar a sus automóviles autónomos a ver objetos y para mejorar Google Maps.

El problema se veía venir, las máquinas volvieron a aprender el reconocimiento de objetos hasta hacerlo mejor que los humanos.

La propuesta más actual es reCaptcha v3 que verifica si eres un humano basado en tu comportamiento.

Si se detectan patrones extraños, como clics o escritura demasiado rápidos, entonces se te pedirá contestar alguno de los captchas anteriores.

Una acción que requiere menos interacción de parte del usuario pero tal vez más invasiva.

Después de todo tiene que haber un rastreo constante que asegure que tu comportamiento es el de un humano.

La entrada Captchas; origen, evolución y porqué son tan complicados se publicó primero en Cristian Monroy.


Volver a la Portada de Logo Paperblog