Localizar conjuntos de datos públicos para los utlizar en modelos es una tarea ardua y complicada. Normalmente es necesario probar en diferentes repositorios para encontrar datos que se adapten a las necesidades puntuales de un proyecto.
La solución a este problema se puede encontrar en el nuevo servicio que acaba de lanzar Google en fase beta: Google Dataset Search. Como su nombre indica es una herramienta para la búsqueda de conjuntos de datos en tablas o bases de datos públicas. Para esto han los datos han de estar etiquetados mediante estándares abiertos de indexación como como scheme.org.
El funcionamiento de buscador Google Dataset Search es similar al de Google. Simplemente se ha de acceder a la URL https://toolbox.google.com/datasetsearch e indicar el tipo de dato que se desea buscar.
Google Dataset SearchUna vez realizado se aparecerá un listado con el conjunto de datos y los detalles de estos.
Ejemplo de resultados obtenidos en Google Dataset SearchImágenes: Pixabay