Está a punto de transformar los campos de la predicción de terremotos a la detección del cáncer, y ahora los científicos están desatando el poder del aprendizaje profundo en un nuevo campo: la ecología.
Un equipo de investigadores de Harvard, la Universidad de Auburn, la Universidad de Wyoming, la Universidad de Oxford y la Universidad de Minnesota demostró que la técnica de inteligencia artificial puede ser usada para identificar imágenes de animales capturadas por cámaras con sensor de movimiento.
Utilizando más de tres millones de fotografías del proyecto de ciencias ciudadanas Snapshot Serengeti, los investigadores capacitaron al sistema para identificar, contar y describir automáticamente a los animales en sus hábitats naturales. Los resultados mostraron que el sistema fue capaz de automatizar el proceso para hasta un 99,3 por ciento de las imágenes con la misma precisión que los voluntarios humanos. El estudio se describe en un artículo publicado el 5 de junio en la revista Proceedings of the National Academy of Sciences.
Snapshot Serengeti ha desplegado un gran número de "cámaras trampa" o cámaras sensibles al movimiento en Tanzania que recogen millones de imágenes de animales en su hábitat natural, como leones, leopardos, guepardos y elefantes.
Aunque las imágenes pueden ofrecer una visión de una gran cantidad de preguntas, desde cómo coexisten las especies carnívoras hasta las relaciones entre depredadores y presas, sólo son útiles una vez que han sido convertidas en datos que pueden ser procesados.
Durante años, el mejor método para extraer esa información era pedir a equipos de voluntarios humanos de origen multitudinario que etiquetaran cada imagen manualmente, un proceso laborioso y que requería mucho tiempo.
"El sistema de inteligencia artificial no sólo te dice cuál de las 48 especies diferentes de animales está presente, sino que también te dice cuántas hay y qué están haciendo. Le dirá si están comiendo, durmiendo, si hay bebés presentes, etc.", dijo Margaret Kosmala, una de las líderes de Snapshot Serengeti y coautora del estudio. "Estimamos que el proceso de aprendizaje profundo que describimos ahorraría más de 8 años de esfuerzo de etiquetado humano por cada 3 millones de imágenes adicionales. Eso es mucho tiempo valioso de voluntariado que puede ser redistribuido para ayudar a otros proyectos".
"Aunque hay varios proyectos que dependen de imágenes capturadas por cámaras trampa para comprender el mundo natural, pocos son capaces de reclutar el gran número de voluntarios que se necesitan para extraer datos útiles", dijo Ali Swanson, fundador de Snapshot Serengeti. "El resultado es que los conocimientos potencialmente importantes permanecen encerrados, fuera del alcance de los científicos.
"Aunque los proyectos están recurriendo cada vez más a la ciencia ciudadana para la clasificación de imágenes, estamos empezando a ver que cada vez se tarda más en etiquetar cada lote de imágenes a medida que crece la demanda de voluntarios", añadió Swanson. "Creemos que el aprendizaje profundo será clave para aliviar el cuello de botella de los proyectos de cámaras trampa: el esfuerzo de convertir imágenes en datos utilizables."
Una forma de inteligencia computacional vagamente inspirada por la forma en que los cerebros de los animales ven y entienden el mundo, el aprendizaje profundo se basa en el entrenamiento de redes neuronales que utilizan grandes cantidades de datos. Sin embargo, para que ese proceso funcione, los datos de la capacitación deben estar debidamente etiquetados.
"Cuando le dije a Jeff Clune (autor principal) que teníamos 3,2 millones de imágenes etiquetadas, se detuvo en su camino", dijo Craig Packer, que dirige el proyecto Snapshot Serengeti. "Nuestros científicos ciudadanos han hecho un trabajo fenomenal, pero necesitábamos acelerar el proceso para manejar cantidades cada vez mayores de datos. El algoritmo de aprendizaje profundo es asombroso y superó con creces mis expectativas. Este es un juego que cambia la ecología de la vida silvestre".
De cara al futuro, el primer autor, Mohammad Sadegh Norouzzadeh, cree que los alogritos de aprendizaje profundo continuarán mejorando y espera que se apliquen sistemas similares a otros conjuntos de datos ecológicos.
"Aquí, queríamos demostrar el valor de la tecnología a la comunidad de ecología de vida silvestre, pero esperamos que a medida que más gente investigue cómo mejorar el aprendizaje profundo para esta aplicación y publicar sus conjuntos de datos, el cielo es el límite", dijo. "Es emocionante pensar en todas las formas en que esta tecnología puede ayudarnos en nuestras importantes misiones científicas y de conservación."
"Esta tecnología nos permite recolectar datos sobre la vida silvestre de manera precisa, discreta y económica, lo que podría ayudar a catalizar la transformación de muchos campos de la ecología, la biología de la vida silvestre, la zoología, la biología de la conservación y el comportamiento de los animales en ciencias de'grandes datos'", dijo Jeff Clune, Profesor Asociado de Harris en la Universidad de Wyoming y Gerente Senior de Investigación en los Laboratorios de Inteligencia Artificial de Uber, y autor principal del artículo. "Esto mejorará dramáticamente nuestra habilidad para estudiar y conservar la vida silvestre y los ecosistemas preciosos."
"This technology lets us accurately, unobtrusively, and inexpensively collect wildlife data, which could help catalyze the transformation of many fields of ecology, wildlife biology, zoology, conservation biology, and animal behavior into 'big data' sciences," said Jeff Clune, the Harris Associate Professor at the University of Wyoming and a Senior Research Manager at Uber's Artificial Intelligence Labs, and the senior author on the paper. "This will dramatically improve our ability to both study and conserve wildlife and precious ecosystems."