Word Camera el lenguaje y la inteligencia artificial

Publicado el 30 agosto 2015 por Carmen Ferreira @negocioscaninos

Word Camera el lenguaje y la inteligencia artificial.

Word camera es una aplicación que interpreta una fotografía convirtiéndola en texto, el texto no es una simple descripción de palabras sueltas sino algo mas subjetivo, podíamos decir que describe en prosa la imagen que acaba de analizar, o mas bien escribe unos párrafos sobre aquellos aspectos que ha podido identificar estableciendo concordancias entre ellos y una amplia base de datos de libros y escritos.

Aunque nos parezca algo del futuro, la inteligencia artificial es uno de lo sectores tecnológicos en los que mas se invierte actualmente, junto a Big Data y al análisis predictivo.

Word Camera convierte imágenes en un texto pero no llega a ser el "dime lo que veo" (tampoco lo pretende), sino otro tipo de percepción. No sustituye a la vista humana, ni al talento del escritor , sino crea interacción coherente entre la imagen y el texto devuelto.

Este aspecto creativo de la inteligencia artificial, puede abrir muchas puertas a otras vías de estudio y de análisis mas profundos del pensamiento humano y la creatividad en si para las nuevas tecnologías.

El proceso para usar esta aplicación es muy sencillo

Subes un archivo desde cualquier dispositivo y en un momento recibirás la re-interpretación de la imagen que realiza la word camera.

Esta interpretación es muy compleja, parece fruto de citas de libros, descripciones, tópicos... me recuerda a la interpretación que puede hacer de un hecho un oráculo o un brainstorming de un taller literario.

Hablando con un colega hace unos días y me dijo:"Genial, con algo así no habrá que contar cuentos a los niños, sube una foto a ver que te cuenta."

No he podido resistir la tentación y he realizado un experimento con una foto de mi perro, para poner el experimento a prueba he elegido una foto en la que el perro lleva ropa... y claro he vuelto loco al software. Probar con cosas mas sencillas, que no estén en Google images para que no tenga un atributo alt ni una descripción de la cuál partir al realizar el reconocimiento de la imagen.

Cada texto de que procesa la word camera recibe el nombre de Lexograph y puede almacenarse en álbumes que pasan a formar parte del proyecto.

https://word.camera/i/vbL3dMJOl

¿Cómo funciona word Camera?

Word camera trabaja con un software de inteligencia artificial que relaciona la conexiones neuronales gracias a otro proyecto de inteligencia artificial llamado Clarifai que que genera la descripción de palabras a partir de una imagen.

Clarifai es una empresa dedicada a la inteligencia artificial, reconocimiento de imágenes y vídeo (te cuenta la película) se ha convertido en una brillante Startup que el mismísimo Google teme y ha intentado comprar de momento sin exito, de momento tienen DeepMind que se ocupa de la parte de inteligencia artificial.

Aquí podéis ver los mejores artículos al respecto: Clariafai noticias

La base para crear el texto completo es generar primero los sustantivos y adjetivos que el software reconoce en la fotografía, luego lo convierte en f rases que a su vez se traducen a párrafos usando una base de datos que establece la relación entre distintas frases mediante ConceptNet (otro software libre al que todos tenemos acceso) el cual establece conexiones semánticas entre nodos para crear frases bien construidas a partir de una parte del software llamado Photosyntesis.

Lejos de pretender ser un software de adaptación curricular o descripción objetiva, la idea surgió a raiz de otro proyecto de Ross goodwing que trataba sobre un generador para llamado Fiction Generato r, en unos minutos recibes en tu mail un relato con los ingredientes que elijas.

Basta con un vistazo a los proyectos de Ross Goodwin para ver su interés por la creación literaria, la fotografía y la construcción de otros interactivos como el caso de poetizer que es capaz de crear poesía y establecer una analogía con una base de datos de imágenes a medida que es recitado le poema.

Una de las maneras de financiación del proyecto es la posibilidad de enviar postales realizadas con la word camera ( Lexograph) a cualquier parte del mundo por un pequeño donativo.

Su creador Ross Goodwin Ha creado diferentes proyectos en lo que intenta generar mediante distintos programas una serie de textos creados con la menor interacción humana posible, implementando distintos patrones neurales de concordancia.

Aún esta en proceso de pruebas y necesita mejorar notablemente la gramática, pero esto no resta importancia al avance que supone.

La segunda parte d el experimento es la Fiction Camera el artefacto físico capaz de sacar descripciones en lugar de fotografías, en lugar de una descripción adjunta un pasaje de una novela.

Algunos de los papeles o tickets que emite la Fiction Camera sobre las imágenes que registra, todos son numerados para relacionarlos con los párrafos de novelas a las que se atribuye la imagen que captura.

El concepto en sí me parece tan bello: "revelar las palabras".

Es un proyecto abierto y sus archivos están disponibles en git Hub:

https://github.com/rossgoodwin/photosynthesis

Fuentes:

http://www.thehypertext.com/

http://rossgoodwin.com/

http://clarifai.com/

http://conceptnet5.media.mit.edu/