En su Cloud Data Summit, Google Cloud anunció la vista previa de BigLake, un nuevo motor de lago de datos basado en la experiencia adquirida con su almacén de datos en la nube BigQuery.
Aparentemente, Google Cloud se ha ganado una buena reputación en los últimos años como una nube de datos con su almacén de datos BigQuery, sus tecnologías sin servidor Cloud Run y sus herramientas de análisis ML «Vertex AI».
Impulsado por el mismo deseo de unificar lagos y almacenes de datos que llevó a Microsoft a lanzar Azure Synapse hace poco más de un año, Google Cloud anuncia » Gran lago para derribar los silos que separan lagos y depósitos. Silos sinónimo de limitar los análisis, aumentar los riesgos pero también aumentar los costes porque muchas veces es necesario duplicar los datos para realizar análisis cruzados.
« BigLake permite a las empresas unificar sus lagos de datos y almacenes para analizar datos sin preocuparse por el formato o el sistema de almacenamiento subyacente, lo que elimina la necesidad de duplicar o mover datos y reduce los costos y la pérdida de datos. eficiencia explica el editor.
<img class="aligncenter size-medium wp-image-86738" src="https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1-450x290.png" alt="Google Cloud BigLake: arquitectura del sistema" width="450" height="290" srcset="https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1-450x290.png 450w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1-1024x661.png 1024w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1-150x97.png 150w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1-768x496.png 768w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/1_BigLake_architecture.max-1100x1100-1.png 1100w" sizes="(max-width: 450px) 100vw, 450px" title="Google Cloud lanza BigLake y unifica sus plataformas de datos. 22" />
La solución está realmente diseñada con un espíritu de unificación de los diferentes lagos de datos basados en toda la experiencia adquirida por Google Cloud pero también por sus clientes con BigQuery. BigLake, por lo tanto, no solo permite confiar en el almacén de datos de BigQuery y los datos almacenados allí, sino también en los lagos almacenados en AWS S3 y en Azure Data Lake. Todo con la máxima seguridad pero también eficiencia para realizar análisis avanzados y explorar todo el potencial del ML y la IA.
<img class="aligncenter wp-image-86739" src="https://www.informatiquenews.fr/wp-content/uploads/2022/04/BigLake-440x300.jpg" alt="BigLake" width="450" height="307" srcset="https://www.informatiquenews.fr/wp-content/uploads/2022/04/BigLake-440x300.jpg 440w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/BigLake-150x102.jpg 150w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/BigLake-768x524.jpg 768w, https://www.informatiquenews.fr/wp-content/uploads/2022/04/BigLake.jpg 800w" sizes="(max-width: 450px) 100vw, 450px" title="Google Cloud lanza BigLake y unifica sus plataformas de datos. 24" />
« Con BigLake, los clientes obtienen controles de acceso granulares, con una interfaz API que abarca Google Cloud y formatos abiertos como Parquet, así como motores de procesamiento de código abierto como Apache Spark. Estas capacidades extienden las innovaciones de BigQuery durante la última década a los lagos de datos en Google Cloud Storage para crear una arquitectura abierta, flexible y rentable. agrega el editor.
Junto con este anuncio insignia, Google Cloud también anunció dos nuevas funciones que seguramente resonarán entre los usuarios de su servicio de datos.
Una nueva característica » Cambiar secuencias le permite realizar la captura de cambios en tiempo real (CDC – Change Data Capture) en Spanner, la base de datos SQL distribuida de Google Cloud. Esta funcionalidad permite rastrear en tiempo real cualquier cambio (inserciones, actualizaciones, eliminaciones) realizado en los datos y desencadenar eventos Pub/Sub, actualizar análisis, etc.
Otra novedad, Google Cloud anuncia la disponibilidad en versión final de “ Banco de trabajo de IA de Vertex », una nueva herramienta interactiva y fácil de usar para gestionar todo el ciclo de vida de los proyectos de Data Science. » Vertex AI Workbench reúne datos y sistemas de ML en una sola interfaz para que los equipos tengan un conjunto común de herramientas para el análisis de datos, la ciencia de datos y el aprendizaje automático. Los equipos pueden crear, entrenar e implementar un modelo de ML cinco veces más rápido que antes explica el editor.
Lea también:
> Google Cloud Next’21: Entre iniciativas soberanas y multicloud
> Google Cloud lanza tres nuevos servicios de Datos
> Paneles para medir las emisiones de CO2 de Azure y Google Cloud.
> Azure Synapse unifica almacenes de datos y lagos de datos
> Con Azure Purview, Microsoft invierte en el mercado de gobierno de datos
> La startup francesa Saagie extiende su orquestador DataOps a nivel internacional.
[