Cómo conocer la Densidad Urbana de una ciudad desde ortofotos

Por Paisajetransversal @paistransversal
Por Alejandro Cantera

El proyecto define un modelo predictivo de clasificación de densidades urbanas a partir del análisis de ortofotografías de cualquier ciudad del mundo. Por medio de la construcción de un modelo de aprendizaje supervisado de Deep Learning, entrenado con ortofotografias etiquetadas de la ciudad de Madrid, se consigue una herramienta que es capaz de predecir la densidad urbana a partir del procesado de fotografías aéreas de una ciudad.

Predicción de distintos rangos de densidad urbana en la ciudad de Barcelona


Pese a que el modelo también predice la huella urbana, conocer su densidad residencial, definida como el número de viviendas por unidad de superficie, nos aporta información urbana más compleja, ya que muestra  la cantidad de población, y por tanto la cantidad de vida y actividad, que alberga un determinado tejido urbano. El estudio de la densidad urbana nos ayuda a entender mejor la complejidad del organismo de una ciudad, analizando no solo aspectos cuantitativos sino cualitativos.  La baja densidad se caracteriza por un crecimiento expansivo y un alto consumo de recursos, lo que conlleva un aumento de la presión sobre el territorio. Mientras, la alta densidad en zonas urbanas puede provocar una congestión del espacio público y  de los servicios. El objetivo de las ciudades es la búsqueda de una densidad urbana óptima, que permita la diversidad tanto dentro de la ciudad y como en su periferia, consiguiendo un correcto dimensionamiento de los servicios, espacio público y redes. La mejora de la compacidad urbana permite crear un modelo de ordenación resiliente y estable, capaz de albergar propuestas de mejora de la sostenibilidad urbana por medio del entendimiento de la realidad física del territorio. Por ello, resulta de gran utilidad, la creación de un modelo que permita conocer de manera rápida una radiografía de cómo se mueven estos flujos dentro de las ciudades.
La aparición en los últimos tiempos de las técnicas de Deep Learning, y la sistematización de los procesos de análisis de aprendizaje automático, abren un nuevo campo de investigación en el análisis de las ciudades. El crecimiento exponencial de recogida de datos geoespaciales, tanto los tomados por sensores como por drones y satélites, y la mejora de la calidad de estos, nos permite acceder a un gran historial de tendencias y conductas urbanas que a día de hoy aún no han sido explotadas en toda su magnitud. La aplicación del Deep Learning al territorio nos posibilita la creación de herramientas de análisis avanzado no sólo para el estudio de las ciudades, sino para optimizar la toma de decisiones y el diseño urbano.
El Aprendizaje Profundo, es un tipo de aprendizaje automático, construido a partir de un conjunto de neuronas que permiten el procesado de los datos asemejando el comportamiento de un cerebro humano. Hay distintos tipos de redes neuronales, según el tipo de neuronas que uses y su combinación ( lo que se denomina 'arquitectura de la red neuronal'). Para visión artificial y reconocimiento de imágenes se usan Redes Convolucionales ( denominadas CNN). Esta red actúa  de manera similar a las neuronas de la corteza visual, descomponiendo una imagen en una matriz tridimensional y reconociendo patrones por medio de sucesivas transformaciones matriciales no lineales, lo que permite a la Red Neuronal aprender tendencias y comportamientos. El comportamiento de estos modelos predictivos quedan definidos a través de la distribución de los datos, patrones e interacciones con el conjunto de neuronas creadas.

Arquitectura de las distintas Redes Neuronales Convolucionales aplicadas


El reconocimiento de patrones de forma y morfología de las imágenes etiquetadas que se usan en el entrenamiento del modelo, nos permite extrapolar resultados a otras ciudades, surgiendo preguntas sobre la posibilidad de predicción de comportamientos urbanos por medio de procesos computacionales.
Metodología seguida en el proyecto
La densidad residencial se calcula dividiendo la cantidad de viviendas existentes entre unidad de superficie (ha). Los datos se obtienen del registro nº15 (bienes inmuebles) de los datos alfanuméricos catastrales de la ciudad de Madrid y se ponderan sobre una retícula de 250x250m, abarcando la totalidad de la ciudad. Las imágenes ráster proceden del servicio del PNOA (Plan Nacional de Ortofotografía Aérea) del Instituto Geográfico Nacional (IGN). Los modelos predictivos se construyen por medio de Redes Neuronales Convolucionales ( de tres tipos: basic CNN, VGG16 & VGG19), creando modelos según rangos de etiquetado de densidades urbanas ( 4, 7 ,12 labels features).
Los modelos construidos son de aprendizaje supervisado,  esto quiere decir que para que la Red Neuronal aprenda es necesario que se entrene con ortofotos etiquetadas con la información de la densidad de viviendas. El modelo aprende en la fase de entrenamiento con un total de 7500 imágenes etiquetadas según el rangos típico de clasificación de densidades de vivienda :Densidad Nula: 0 viv/ha; Baja Densidad: 10, 20, 40, 60 viv/ha; Densidad Media: 80, 100, 120, 160 viv/ha; Alta Densidad: 200, 240, 320, 400 viv/ha.

Proceso de extracción, limpieza y etiquetado de las ortofotos con los datos obtenidos de Catastro


Posteriormente al proceso de entrenamiento de las distintas redes neuronales, se evalúan los resultados obtenidos con el fin de seleccionar el modelo de mayor capacidad predictiva. Para ello se evalúa la matriz de confusión, que es una herramienta muy útil para visualizar el acierto del algoritmo en un proceso de aprendizaje supervisado, ya que contrasta el número de True Positive,True Negative, False Positive y False Negative. La ponderación de estos valores nos permiten definir métricas como el Recall, la Precisión, la F2score y la Accuracy para determinar el mejor modelo.

Evaluación de las métricas de cada tipo de CNN


Comprobación de las predicciones realizadas por cada CNN


Una vez evaluados y seleccionados cada uno de los modelos según su rango de etiqueta, es necesario probar como funciona con ortofotos de otras ciudades. El principal objetivo es probar la capacidad de predicción de los modelos ante situaciones diversas, ya que no sólo las imágenes pueden haber sido tomadas en otro momento temporal, con otra luz, sino que la morfología urbana de una ciudad puede ser diferente que la de ciudad de entrenamiento.Para la evaluación de esta diversidad urbana se parte del análisis de dos ciudades distintas. En ambos casos, la superficie alberga un área de 80x80 teselas, lo que equivale a una superficie de 400 km2.
Las características de las ciudades elegidas son:
•   Barcelona : una ciudad con características similares urbanas, cuyas imágenes son tomadas de las misma fuente de datos (PNOA) .
•   Bogotá: una ciudad de una configuración distinta y cuya fuente de datos sea también distinta.  El origen de esta imágenes son los servicios wms del Catastro de Bogotá.

Predicción de Densidad Urbana de Barcelona


Predicción de Densidad Urbana de Bogotá


Las predicciones en ambas ciudades muestran resultados coherentes, contrastables con sus datos propios. El modelo construido es un primer proyecto piloto, que pretende establecer las bases de futuros análisis urbanos de predicción de otros indicadores urbanos. Para ello, el modelo debe evolucionar a un sistema de predicción multivariable a partir de una misma fuente ráster (preferiblemente imagen satélite que ortofoto), ganando robustez en sus predicciones. Sin embargo, el proyecto no pretende conseguir la predicción de cualquier territorio por medio del aprendizaje de una única ciudad; es necesario introducir dentro del modelo distintos tipos de ciudades, con morfologías y estructuras distintas para que éste aprenda a discernir distintos patrones de construcción urbana.Pese a todas estas mejoras mencionadas, el objetivo del proyecto es el de la creación de un primer prototipo que sirva de ejemplo de cómo la combinación de datos urbanos con técnicas de aprendizaje profundo puede ayudar a construir una nueva linea de estudios territoriales avanzados usando la inteligencia artificial para el reconocimiento y la clasificación de patrones urbanos, y de esta manera actuar de una manera más consciente en las ciudades.
 

Comparación de predicción de densidad urbana en Barcelona de 7 y 12 categorías de etiquetado




 Alejandro es arquitecto por la Universidad Politécnica de Madrid (ETSAM) y Urban Data Scientist. Se dedica al diseño de nuevas herramientas de análisis avanzado e intervención en zonas urbanas, desde la escala territorial a la de detalle. Ha trabajado en el estudio de Ezquiaga Arquitectura, Sociedad y Territorio colaborando en proyectos como la Revisión del Plan Territorial Insular de Menorca o el Plan de Revitalización del Centro Tradicional de Managua, y a día de hoy desarrolla su carrera profesional en el equipo de Data de una Startup de Location Intelligence. Su trabajo ha sido publicado en Fisuras, Displacement, Bartlebooth and The Funambulist .