Revista Informática

Google comienza a indexar archivos CSV

Publicado el 30 agosto 2023 por Lauratuero @incubaweb

En una actualización silenciosa pero significativa, Google ha añadido una nueva funcionalidad a su motor de búsqueda: ahora indexará archivos con extensión .csv (valores separados por comas). Este cambio tiene importantes implicaciones para editores, webmasters y usuarios que dependen de la búsqueda en Google para acceder a información y recursos.

Cambios en la Documentación de Google Search Central

Hasta hace poco, Google utilizaba datos de archivos CSV solo cuando estos se describían mediante datos estructurados. Sin embargo, la compañía ha actualizado su documentación en Google Search Central para señalar que ahora indexará archivos .csv directamente.

Si eres un editor y no deseas que tus archivos CSV sean rastreados por Google, es probable que debas actualizar tu archivo robots.txt para excluir estos archivos específicos.

¿Qué Son los Archivos CSV?

Los archivos CSV son archivos de texto que guardan datos en un formato tabular. Este tipo de archivo es muy útil para organizar datos en una hoja de cálculo o para cargar una lista de URLs en herramientas de análisis de sitios web como Screaming Frog.

Un Cambio Significativo en la Búsqueda

Antes de este cambio, cuando se realizaba una búsqueda en Google usando la consulta filetype:csv, los resultados no mostraban archivos CSV. Esto ya no será el caso. Esta es una funcionalidad completamente nueva que potencialmente podría cambiar cómo los usuarios acceden a los datos en línea.

Google y los Archivos CSV: Un Historial

Lo que es especialmente interesante es que Google ya ha estado utilizando archivos CSV indirectamente. Según la documentación de la compañía para desarrolladores, los archivos CSV eran aceptables para aparecer en las características de búsqueda de conjuntos de datos cuando se describían con datos estructurados. Esto indica que Google ya tenía la capacidad de interactuar con archivos CSV, pero eligió no indexarlos directamente hasta ahora.

Relación con Actualizaciones Recientes del Algoritmo

Coincidiendo con esta nueva capacidad, Google ha realizado recientemente una actualización significativa de su algoritmo central. Aunque no se puede confirmar que ambos eventos estén relacionados, podría ser un indicio de que Google está mejorando su motor de rastreo para abarcar más tipos de contenido.

Lista Actualizada de Tipos de Archivos Indexables

Este cambio se suma a la ya extensa lista de tipos de archivos que Google puede indexar, que incluye desde documentos PDF y archivos de Microsoft Office hasta formatos de texto enriquecido y archivos de programación.

En resumen

La decisión de Google de indexar archivos CSV representa una importante evolución en la forma en que el gigante de la búsqueda interactúa con los datos en la web. Los editores deberán estar atentos a este cambio, especialmente si manejan grandes cantidades de datos en archivos CSV que podrían ser indexados por Google.


Volver a la Portada de Logo Paperblog