Eliminar automáticamente elementos molestos de imágenes ya es posible

Publicado el 07 septiembre 2015 por Lauratuero @incubaweb

Investigadores de la universidad de Princeton junto con Adobe crean un software para eliminar automáticamente elementos molestos de nuestras imágenes.

Un grupo de investigación de la Universidad de Princeton junto con Adobe, la conocida empresa de software destacada en multimedia, han desarrollado una serie de algoritmos que permiten eliminar lo que ellos llaman distractores de las imágenes. Según relatan, los distractores son “las regiones de una imagen que desvían la atención de los temas principales y reducen la calidad general de la misma.”

Estos algoritmos han sido creados a partir de varios conjuntos de imágenes que contenían anotaciones de usuarios que identificaban los elementos molestos o distractores. Los algoritmos han sido entrenados con estos datos para lograr identificar los elementos molestos y lograr eliminarlos.

¿Qué se considera elemento molesto?

Para lograr eliminar automáticamente elementos molestos o distractores, primero hay que concretar lo que entendemos por objeto molesto. La primera característica que podemos deducir es que son elementos visuales que atraen nuestra atención, haciendo perder el foco en el objeto principal de la imagen.

Los estudios apuntan a que los distractores no consiguen hacerse con el foco principal de nuestra visión, pero consiguen entorpecer la percepción visual del elemento principal de la imagen. Podemos decir entonces que los distractores nos hacen perder la atención respecto al elemento principal de la imagen.

Además dependiendo de la naturaleza de la imagen y los colores de los que está compuesta, los distractores pueden ser más o menos intensos. Por ejemplo, en una fotografía de noche un distractor de naturaleza luminosa es mucho más potente que un objeto oscuro. Podemos concluir por tanto que los distractores dependen de las características particulares de las fotos.

¿Cómo solucionamos el problema?

El estudio parte de la hipótesis de que los seres humanos comienzan a percibir los distractores después de un relativamente largo periodo de tiempo mirando la imagen, y sólo fijan el foco visual en ellos cuando se les da instrucciones para hacerlo. Existen métodos computacionales de detección de prominencia visual que se basan en que el tema principal de la foto es el que mayor valor de prominencia tiene, y lo que hacen es reducir el valor de prominencia según la imagen se aleja del centro. Otros métodos conocidos tratan de recortar la imagen para eliminar los distractores situados en los bordes.

Tras un estudio de las investigaciones realizadas hasta ahora han concluido que las herramientas existentes son insuficientes. Para eliminar automáticamente los elementos molestos los chicos de Princeton y Adobe han optado por utilizar sistemas basados en el conocimiento, es decir, han optado por crear una base de conocimientos en la que se recoge la experiencia individual de los usuarios acerca de qué elementos les parecen molestos o no.

Para ello han elaborado 2 bases de datos con imágenes: una a través de Amazon Mechanical Turk y la otra mediante una aplicación móvil. En ambos casos se se pedía que seleccionasen las regiones imágenes que, a su criterio, contenían elementos molestos. Mediante Amazon Mechanical Turk la recolección es muy sencilla, pero los datos obtenidos están sesgados: los trabajadores de la plataforma seleccionan las regiones de las imágenes aleatorias que se proporcionan por la recompensa que obtienen, sin tener ninguna expectativa personal de mejora de la misma.

Por esta razón se introdujo la aplicación móvil, gratuita en el mercado de aplicaciones y accesible para todos los usuarios. En ella se daba una preview de una imagen subida por el usuario sin la sección seleccionada, siendo de utilidad para los usuarios que desearan eliminar, por ejemplo, títulos molestos de una imagen. Con esta aplicación se obtuvieron más de 5000 imágenes con más de 44000 acciones sobre ellas (selección de regiones por parte de los usuarios).

Construyendo el algoritmo

Con las bases de datos creadas, el siguiente paso es añadir conocimiento a los procesos algorítmicos existentes. Mediante la construcción de diversos procesos de mapeado y la aplicación del conocimiento recopilado se ha conseguido construir un sistema que reconoce la mayor parte de los distractores. Estamos hablando de que el sistema consigue eliminar distractores satisfactoriamente entre el 80 y 85 % de los casos, siendo una cifra más que notable en comparación con los métodos conocidos hasta la fecha.

Cada día es más común la aplicación de la inteligencia artificial a problemas que computacionalmente no pueden ser resueltos. Digamos que es como emplear ciertas características del cerebro humano para resolver problemas que sin ellas no serían viables. En este caso ha sido aplicada a eliminar automáticamente elementos molestos de imágenes, cuya utilidad parece estar limitada para ciertos sectores, pero cada día más áreas se ven reforzadas por este sector.

Para los que estéis interesados en detalles, os dejo el link con los detalles del estudio sobre cómo eliminar automáticamente elementos molestos de imágenes, en el que se especifican más detalladamente las técnicas y algoritmos utilizados. ¿Os parece interesante este trabajo?